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CHAPITRE 1 


Introduction 


1. Interaction stratégique 

La théorie des jeux vise à analyser des situations d’interaction stratégique où 
plusieurs entités (agents, populations, entreprises, automates, ...) sont porteuses de 
caractéristiques (actions, gènes, prix, codes, ...) qui les affectent mutuellement. Plu- 
sieurs niveaux de modélisation ont été proposés. Nous les passons rapidement en vue. 

1.1. Jeux stratégiques. 

Ce cadre correspond à Taxe qui sera privilégié dans ce cours. 

Il consiste d’abord à identifier les structures autonomes qui interagissent, appelées 
joueurs. Par autonomie on entend le fait que leurs caractéristiques, paramètres ou 
choix, appelés actions , sont déterminés de manières indépendantes les uns des autres. 
Un profil d’actions induit un résultat et chaque joueur possède une fonction d’évalua- 
tion définie sur l’espace des résultats et à valeurs réelles. 

1.2. Jeux coalitionnels. 

Dans cette approche la donnée initiale est encore un ensemble de joueurs mais sont 
pris en compte tous les sous-ensembles possibles, appelés coalitions et une fonction 
d’effectivité associe à chacune d’entre elles la famille des résultats qu’elle peut at- 
teindre. La problématique consiste alors à en déduire un résultat global pour tous les 
joueurs. 

Il s’agit ici d’un point de vue plus “normatif” ou axiomatique qui à partir de considé- 
rations sur des normes d’équité, de pouvoir ou d’efficience propose une solution. 

Le lien avec l’approche précédente est à double sens : 

Passage 1.1. — > 1.2. : des analyses d’ordre stratégique sur le choix des actions d’une 
coalition permettent de définir une fonction caractéristique (ou d’effectivité) et on 
applique ensuite le programme des jeux coalitionnels. 

Passage 1.2. — » 1.1. : “programme de Nash”. Partant de la fonction d’effectivité on dé- 
finit des actions et une fonction d’évaluation telle que le jeu stratégique correspondant 
induise la solution choisie. 
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1.3. Choix social. 

Il s’agit ici de l’étude, dans le cadre d’un jeu défini par un ensemble de joueurs, de 
l’impact des règles sur le résultat final. L’intérêt se déplace de l’examen des compor- 
tements stratégiques vers l’analyse de l’influence de la procédure sur le déroulement 
du jeu. Les domaines connexes sont les théories des incitations et des contrats. 

2. Exemples 

2.1. Mariages stables. 

On considère deux familles finies I et J (hommes/femmes, employés/firmes ...) de 
même cardinal tel que chaque élément i G / (resp. j G J) possède un ordre total strict 
sur J (resp. I). Le problème est l’existence et la caractérisation des mariages stables, 
i.e. des bijections ir de I dans J telles qu’il n’existe pas de couples (£,7r(£) = j), 
(i\ 7r (i f ) = j') avec j' préféré par i à j et simultanément i préféré à i' par j'. (Voir 
Exercice 1.1). 

2.2. Problème de partage. 

On représente par [0, 1] un ensemble sur le partage duquel deux joueurs ont des pré- 
férences. Le jeu se déroule entre les instants 0 et 1. Le joueur qui arrête le premier 
à l’instant t gagne la part [0, t] de l’ensemble, son adversaire ayant le complément. 
On suppose que a\(t) (resp. a, 2 (t)) qui décrit 1’ évaluation par le joueur 1 (resp. 2) de 
[0 ,£], est une fonction continue croissante de 0 à 1 (1 — a*(£) est alors l’évaluation du 
complémentaire). Chaque joueur i peut obtenir 1/2 en décidant d’arrêter à l’instant 
U avec = 1/2 (si l’adversaire arrête avant, tant mieux). Par contre si ti < 

et que le joueur i le sait, il peut anticiper que j ne va pas arrêter avant tj et tenter 
tj—e. On voit apparaître ici des questions liées à l’information sur les caractéristiques 
de l’adversaire, aux anticipations sur son comportement (rationalité) et à l’influence 
de la procédure sur l’issue (j souhaite si U < t j, que l’on partage en allant de 1 à 0). 
(Voir Exercice 1.2). 

2.3. Equilibre de transport. 

On modélise par l’intervalle [0, 1] muni de la mesure de Lebesgue un ensemble formé 
d’un grand nombre de joueurs négligeables, chacun utilisant soit une voiture, soit le 
métro. On suppose qu’ils ont tous la même évaluation du traffic qui se traduit par 
une fonction croissante u, resp. m, de [0, 1] dans lui même, v(t) étant leur “utilité” 
si ils utilisent la voiture (resp. le métro) quand une proportion t de la population 
prend le métro. Si v > m le seul équilibre est t = 0, même si le résultat u(0) peut 
être inférieur à un autre résultat possible m(l). Si les courbes m et v se coupent, les 
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points d’intersection sont des équilibres qui peuvent être stables ou instables. (Voir 
Exercice 1.3). 

2.4. Enchères. 

Un objet est mis aux enchères et n joueurs ont des valuations v^i = l,...,n, à son 
sujet. On peut considérer des enchères descendantes où le prix d’offre p décroit jusqu’à 
une acceptation, ou montantes où les joueurs font des offres croissantes successives. 
Un autre modèle correspond au cas où les joueurs font des offres bi par écrit et l’arbitre 
attribue l’objet au joueur ayant fait la plus grande offre. Si le prix à payer est la plus 
grande offre, les joueurs ont intérêt à connaitre les préférences de leurs adversaires. Si 
le prix correspond à la deuxième plus grande offre, la stratégie bi = Vi correspondant 
à une enchère sincère est dominante. (Voir Exercice 1.4). 

2.5. Paradoxe de Condorcet. 

3 joueurs a, 6,c ont des préférences strictes sur 3 candidats A,B,C. Si a classe 
A > B > C, b classe B > C > A et c classe C > A > B, une élimination binaire des 
candidats de la forme : on choisit à la majorité entre A et B , puis le vainqueur est 
opposé à C, etc ... induit un cycle sur les candidats. 

On modélise maintenant des situations dynamiques. 

2.6. Jeu d’évolution. 

On considère une compétition entre 3 bactéries : a produit des virus et des anti- virus. 
b produit des anti- virus et c ne produit rien. La production est coûteuse donc b gagne 
face à a et c face à b mais a infeste c. On est en présence d’un cycle. Il peut exister 
un point stationnaire intérieur (où les 3 bactéries sont présentes simultanément) mais 
son type peut être attractif ou répulsif. 

2.7. Jeu stochastique. 

On considère une situation où 2 pêcheurs exploitent la même espèce qui est en quan- 
tité importante (a), faible (6) ou en extinction (c). Les joueurs ont une activité intense 
(/) ou réduite (R.) et le résultat de leur activité qui dépend de l’état de l’espèce (a, b 
ou c) est une quantité de pêche et une probabilité sur le nouvel état. Ceci définit un 
jeu stochastique. Dans l’état a la quantité de pêche est 


I 

R 


I R 


100, 100 

120,60 

60, 120 

80,80 
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et l’évolution de l’état est défini par 


I 
R 

Par exemple si le joueur 1 pêche beaucoup (/) et le joueur 2 peu (i?.), leurs gains 
seront (120,60) et l’état le jour suivant sera a avec probabilité 0.5, resp. (6; 0.4) et 
(c;0.1). 

Dans l’état b les données sont pour les résultats 


I 

R 

et pour les transitions 


I 

R 

et dans l’état c la pêche est nulle et l’état absorbant. Il y a clairement un conflit 
entre le gain immédiat et l’état futur, et le comportement dépend de la durée de 
l’interaction. (Voir Chapitre 8, Section 5). 

2.8. Jeu répété. 

On considère une situation d’interaction répétée entre 2 joueurs où le résultat de 
l’interaction chaque jour est donné par 


a 
b 

Si on ne tient pas compte du futur, on obtient une répétition de (a, /3) mais on peut 
introduire des menaces du type “jouer /3 pour toujours dans le futur” pour stabiliser 
le résultat (6, a). L’utilisation du couple plan et menaces est fondamental dans l’étude 
des jeux répétés. (Voir Chapitre 8). 


a p 


10,0 

1,1 

5,5 

0,0 


I R 


(0,0.5, 0.5) 

(0.1, 0.6, 0.3) 

(0.1, 0.6, 0.3) 

(0.8, 0.2,0) 


I R 


50,50 

60,30 

30,60 

40,40 


I R 


(0.3, 0.5, 0.2) 

(0.5, 0.4, 0.1) 

(0.5, 0.4, 0.1) 

(0.6, 0.4,0) 
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3. Notations et concepts de base 

3.1. Jeu stratégique. 

Un jeu stratégique sous forme normale G est défini par : 

- un ensemble I de joueurs (de cardinal n) 

- un ensemble S 1 de stratégies pour chaque joueur i e I 

- une application g de S = dans E n . 

g l (s l , • • • , s n ) est le gain du joueur i lorsque le profil s = (s 1 , • • • , s n ) est joué. On 
note aussi s = (s 2 , s _î ) où s~ l dénote le vecteur des stratégies des joueurs j autres 
que i et = Tlj^i Sf 

Plus généralement une forme jeu est une application F de 5 dans un espace de résul- 
tats i?.. Chaque joueur a un préordre total >~i sur B.. Si celui-ci est représenté par une 
fonction d’utilité u l de B. dans JR la composition u l o F donne g 1 qui est l’évaluation 
par i du résultat. (Cela revient à prendre comme ensemble de résultats l’ensemble S 
des profils.) 

3.2. Domination. 

Pour x et y dans lB n on note : 
x » y si x % > y z , Vz, 
x > y si x l > y 1 , Vz, et x ^ y, 
x > y si x % > y l ) Wi. 

s 1 est une stratégie strictement dominante (resp. dominante) si 

g\s\.)»g\t\.) W e S\ 

resp. 

9\s\.)>g\t\.) W e S\ 

s 1 est strictement dominée (resp. faiblement dominée) si il existe t l avec 

g\s\.) « g\t \ .) 

resp. 

9\s\.)<g\t\.). 

3.3. Elimination itérée. 

Le jeu est résoluble si V élimination itérée des stratégies strictement dominées converge 
vers un ensemble réduit à un point (en particulier si chaque joueur possède une stra- 
tégie strictement dominante), voir Example 4.1. 

3.4. Meilleure réponse. 

La correspondance de e-meilleure réponse (e > 0), BB. l E de S~ l dans est définie 
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par : 

BR^s- 1 ) = {s i G S i : g\s\ s "*) > g\t\ s"*) - e, Vf G S *}. 

Elle associe à tout profil de stratégies des joueurs autres que z, l’ensemble des e- 
meilleures réponses du joueur i. 

3.5. Extension mixte. 

Dans le cas d’espaces de stratégies mesurables {S 1 y S 1 ) y une extension mixte du jeu G 
est la donnée pour chaque iy d’un sous ensemble T 1 de l’ensemble des probabilités sur 
(S 1 y S 1 ) y convexe et contenant (identifié aux masses de Dirac). 

On suppose que le théorème de Fubini s’applique à l’intégrale de g sur T = n™ =1 T\ 
Cela permet de définir le paiement étendu qui est l’espérance par rapport à la distri- 
bution produit générée par les stratégies mixtes des joueurs : 

g\t) = fgfts ) t'ids 1 ) ® ® t n (ds n ). 

Explicitement, dans le cas fini, si A = niLi A(S l ) dénote l’ensemble des stratégies 
mixtes et si a est le profil g = (a 1 , ..., a n ) G A, le paiement pour le joueur i dans 
l’extension mixte du jeu est : 

«•M-XU. , )a ,n/ev<«>- 

et correspond à l’extension multilinéaire de g. 

4. Information et rationalité 
4.1. Stratégie dominante et résultat dominé. 


a 

b 


a p 


10,0 

1,1 

5,5 

0,0 


Dans ce jeu, a domine strictement 6, puis (3 est une meilleure réponse à a, d’où le 
résultat (1,1) par élimination itérée. 

En l’absence de a, le résultat est (5,5). 

4.2. Ordre d’élimination. 


a 

b 


a p 


2,2 

1,2 

2,0 

0,1 


(2,2) est éliminé par domination faible si on commence par le joueur 2, mais pas si 
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on commence par le joueur 1. 

Résultat : Il n’y a, par contre, pas d’ambiguité pour l’élimination itérée via domina- 
tion stricte. 

4.3. Domination et Pareto optimalité. 

Dans le jeu suivant 


1,0 

0,1 

1,0 

0,1 

1,0 

1,0 

0,1 

0,1 

1,1 


(1,1) est le seul paiement parétien et est éliminé par domination faible. 

4.4. Hypothèses de connaissance. 

Il est fondamental de distinguer la connaissance de l’état ou factual knowledge , qui 
correspond à la connaissance des paramètres du jeu : stratégies, paiements (dans ce 
cadre les procédures autonomes pour un joueur sont celles qui ne dépendent que de 
ses propres stratégies et de son propre paiement), et la connaissance du monde ou 
epistemic knowledge qui consiste en plus en la connaissance de l’information et de la 
rationalité (éventuelle) des adversaires. 

On fait alors face à un paradoxe circulaire : pour définir la rationalité d’un joueur il 
faut spécifier son information qui inclut, entre autres, son information sur la rationa- 
lité de ses adversaires. 

4.5. Domination et extension mixte. 

La notion de domination dépend du cadre considéré : 

a 
b 
c 

La stratégie b n’est pas dominée par a ou b mais est dominée par la stratégie mixte 

è a + è c - 


CO 

0 

1 

1 

0 

co 


4.6. Dynamique et anticipation. 

La différence principale dans les situations dynamiques entre la modélisation en terme 
de jeu répété ou de jeu d’évolution est la prise en compte, ou non, par chaque joueur, 
des conséquences de son action présente sur le comportement futur des autres par- 
ticipants. Le premier modèle tient compte des interactions dues à des anticipations 
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rationnelles. Le second décrit les conséquences au niveau global de procédures adap- 
tatives myopes et locales. 
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CHAPITRE 2 


Jeux à somme nulle : le cas fini 


Les jeux à somme nulle sont les jeux à deux joueurs où la somme des fonctions 
de paiement est nulle. Dans ce type d’interaction stratégique, les intérêts des joueurs 
sont opposés donc le conflit est total et il n’y a pas de coopération possible. 


1. Généralités, valeur et stratégies optimales 

Définition 1.1. Un jeu à somme nulle sous forme stratégique est défini par un triplet 
(I,J,g) où I (resp. J) est l’ensemble (non vide) d’actions du joueur 1 (resp. 2), et 
g : I x J — > M est la fonction de gain du joueur 1. 

L’interprétation est la suivante. Indépendamment, le joueur 1 choisit i dans I et le 
joueur 2 choisit j dans J. Le paiement du joueur 1 est alors g(i,j ), et celui du joueur 
2 est —g(i,j) (les évaluations du résultat induit par le choix (i,j) sont opposées pour 
les deux joueurs). Avec les notations du chapitre 1 on a donc g 1 = g = — g 2 d’où la 
terminologie jeu à somme nulle. Chacun des deux joueurs connaît le triplet (/, J>g). 

Lorsque I et J sont finis, on dit, sans surprise, que (/, J, g) est un jeu à somme 
nulle fini. On représente alors le jeu par une matrice A, où le joueur 1 choisit la ligne 
i y le joueur 2 choisit la colonne j, et l’entrée Aij de la matrice représentent le paiement 
g(i y j ). Par exemple, le jeu suivant est appelé Matching Pennies : 


1 

-1 

-1 

1 


Réciproquement, toute matrice réelle peut être vue comme un jeu fini à somme nulle, 
aussi appelé jeu matriciel. 

On fixe dans la suite un jeu à somme nulle G = (/, J, g). Le joueur 1 maximise la 
fonction de paiement <7, mais celle-ci dépend de deux variables i et j 9 et le joueur 1 
ne contrôle que la variable i et pas la variable j. A l’opposé, le joueur 2 minimise g , 
et contrôle j mais pas i. 

Définition 1.2. Le joueur 1 garantit w G M U {- 00 } dans G si il possède une action 
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qui lui assure un paiement au moins égal à w, Le. si : 

3i e iyj e J, g(i,j) > w. 

Symétriquement, le joueur 2 garantit w eR U {+oo} dans G s’il a une action qui lui 
assure de ne pas perdre plus que w, Le. si 

3j e J, Vie I , g(i, j) < w. 

Il est clair que pour tout i dans I le joueur 1 garantit inf j^j g{i,j), et pour j dans 
J le joueur 2 garantit sup ieI g(i, j). 

Définition 1.3. 

Le maxmin de G, noté y, est la quantité sup^ €l inï j€J g(i,j) eMU{+oo}. 

Le minmax de G, notév, est la quantité infjg j sup i€/ g(i, j) e MU {— 00 } . 

Ainsi, le maxmin est le supremum des quantités garanties par le joueur 1, et le 
minmax est l’infimum des quantités garanties par le joueur 2. Le maxmin peut être 
vu comme l’évaluation de l’interaction où le joueur 1 choisirait i en premier, puis le 
joueur 2 choisirait j en connaissant i. Il s’agit de la pire situation pour le joueur 1 et 
donc conduit à une borne inférieure sur son paiement. De même, le minmax corres- 
pond à l’interaction où c’est le joueur 2 qui joue en premier, puis le joueur 1 joue en 
connaissant l’action de son adversaire. (Si le joueur 1 joue en premier mais que son 
choix n’est pas connu par le joueur 2, il y a indépendance des choix). 

Le fait que la première situation soit moins favorable au joueur 1 se traduit par le 
lemme suivant : 

Lemme 1.4. 

y < v. 

Preuve : Pour tous i dans I et j dans J, on a : g(i,j) > inij'ej g{i, /). En prenant le 
sup en i de chaque côté, on obtient : sup ieI g(i,j) > y , pour tout j de J. En prenant 
maintenant l’inf en j , on arrive à : v > y. ■ 

L’écart v — y est appelé le saut de dualité. 

Définition 1.5. On dit que le jeu G a une valeur si y = v, et dans ce cas la valeur 
v = val(G) de G est par définition y = v. 

Dans l’exemple Matching Pennies, on a : y = — 1 < 1 = v, et le jeu n’a pas de 
valeur (on verra plus tard que l’extension mixte du jeu a une valeur). 

Lorsque le jeu a une valeur, v (= v = y), celle-ci correspond à l’issue rationnelle du 
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jeu, au sens de l’évaluation considérée comme équitable par les deux joueurs du jeu. 
La valeur peut alors être vue comme le prix du jeu G. 

Lemme 1.6. 

S’il existe w qui peut être garanti à la fois par le joueur 1 et le joueur 2, alors w est 
unique et le jeu a une valeur qui vaut w. 

Preuve : On a alors w < v < v < w. ■ 


Définition 1.7. Une stratégie du joueur 1 est dite maxmin e-optimale si elle garan- 
tit v — e. Si le jeu a une valeur y une telle stratégie est simplement dite e-optimale. 
Les stratégies e-optimales du joueur 2 sont définies de façon duale. Les stratégies 
O-optimales sont dites optimales . 

Exemple : G = ( JFV , IV, g), où g(i,j) = 1 /(i + j + 1). Le jeu a une valeur qui est 0. 
Toutes les stratégies du joueur 1 sont optimales, et le joueur 2 n’a aucune stratégie 
optimale. 

Lorsque les espaces I et J ont une structure mesurable, on peut considérer les 
extensions mixtes de G (cf. Chapitre 1, Section 3). Si une stratégie dans I garantit 
w dans G, alors la même stratégie garantit également w dans toute extension mixte 
X, Y de G. En effet par linéarité de l’intégrale en y, g(x,y) = fjg(x,j)dy(j) > w 
pour tout y G T, dès que g(x y j) > w pour tout j G J. 

On en déduit : 

Lemme 1.8. 

Le saut de dualité d’une extension mixte de G est inférieur au saut de dualité initial 
de G. 

En particulier, si un jeu à somme nulle possède une valeur, alors toute extension mixte 
du jeu a également la même valeur. 

Dans la suite de ce chapitre, on considère principalement le cas d’un jeu à somme 
nulle fini. 


2. Le théorème du minmax 

En théorie des jeux, on autorise souvent les joueurs à choisir leurs actions de 
manière aléatoire. Par exemple, si l’on doit jouer dans Matching Pennies, ou pro- 
grammer un ordinateur qui va jouer ce jeu “on line”, il est clairement intéressant de 
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choisir chaque action avec probabilité 1/2, afin de cacher à l’adversaire la ligne ou 
la colonne que l’on va jouer. (Une autre interprétation des actions “mixtes” est que 
la probabilité associée aux actions d’un joueur ne représente que la croyance de son 
adversaire sur son comportement (Harsanyi, 1973a) : voir le Chapitre 7). 
Mathématiquement, considérer des actions mixtes permet d’avoir des ensembles d’ac- 
tions convexes. 

Si S est un ensemble fini de cardinal n, on note A (S) l’ensemble des probabilités 
sur S (ou le simplexe sur S) : 

A (S) = {xeE n -,x 3 > 0,Vs € S-,J2^ s x s = 1}. 

L’extension mixte d’un jeu fini G = (/, J, g) est alors le jeu T = (A(J), A(J),7), où 
la fonction de paiement g est étendue de manière multilinéaire en 

7 (x,y) = Ex®î/ 9 = y\ .X l y 3 g{i,j). 

J 

Un élément x de A(J), resp. y de A(J), est appelé stratégie mixte du joueur 1, resp. 
joueur 2, dans le jeu T. Par opposition, un élément de /, resp. J, est assimilé à une 
mesure de Dirac et est appelé stratégie pure du joueur 1, resp. joueur 2, dans T. 

Le support d’une stratégie mixte x du joueur 1, noté supp (x), est l’ensemble des stra- 
tégies pures i telles que x 1 > 0. 

On représentera souvent le jeu G par la matrice A avec Aij = g(i,j) pour tout (z, j) 
dans I x J. Un élément x de A (J) sera alors vu comme une matrice ligne, et un 
élément y de A (J) comme une matrice colonne, de façon à pouvoir écrire le paiement 
comme la forme bilinéaire 7 (x,y) = xAy. 

Théorème 2.1 (Von Neumann , 1928). Minmax 
Soit A une matrice réelle I x J. 

Il existe (x* } y*,v) dans A(J) x A (J) x M tel que : 

(1) x*Ay >v, \/y G A (J) et xAy * < v, Vx G A(J). 

Autrement dit, l’extension mixte d’un jeu matriciel a une valeur (on dit aussi que 
tout jeu à somme nulle fini a une valeur en stratégies mixtes), et les joueurs y ont des 
stratégies optimales. 

Le réel v du théorème est unique, et correspond précisément à la valeur de la matrice 
A : 

v = max min xAy = min max xAy 
xeA(i) y eA(j) y eA(j)xeA(i) 

que l’on note également val (A). 

En tant qu’application de M /xJ dans K, l’opérateur val est continu, croissant et non 
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dilatant : |val(A) — val(J9)| < || A — J5||oo (voir Chapitre 3, Section 3). 

Il existe de nombreuses preuves du théorème du minmax. Une démonstration 
classique repose sur le théorème de dualité en programmation linéaire. 

Les deux programmes : 

min < c y x > max <u y b > 

(Vi) Ax >b (V 2 ) uA < c 

x > 0 u > 0 

sont duaux et ont même valeur dès qu’ils sont réalisables, i.e. si les ensembles 
{Ax > b\x > 0} et {uA < c\u > 0} sont non vides. Ce résultat est lui même 
une conséquence du théorème de l’alternative pour des systèmes linéaires (voir par 
exemple, Sorin (2002), App. A). 

Preuve : On se ramène au cas où A 0. 

On considère les deux programmes duaux 

min < X, c > max < b, Y > 

(Vi) XA > b (V 2 ) AY <c 

X >0 Y >0 

où les variables vérifient X G JR rn y Y G JR n , et les paramètres sont donnés par 
c G JR m , Ci = l,Vi et b G JR n y bj — 1 ,Vj. 

(V 2 ) est réalisable avec Y = 0 et (V\) en prenant X assez grand, par hypothèse sur 
A. 

Il existe donc un triplet X* y Y* y w avec 

X* > 0, Y* > 0, X*A > b, AY* < c, J2i X i = Yj Y i = w 

X* 7^ 0 implique w > 0 soit en divisant par w, l’existence de ( x* y y *) G A (/) x A (J) 
avec 

x*Aj > l/w y \/jy iAy* < l/w y Wi. 

La valeur existe et vaut 1 /w y x * et y* sont des stratégies optimales. ■ 

Une preuve plus constructive du théorème de Von Neumann peut être obtenue en 
construisant un algorithme d’approchabilité (voir Exercice 2.4). Par ailleurs, on peut 
aussi utiliser le théorème de Loomis (Théorème 4.1) dont la preuve repose sur une 
récurrence sur la dimension. 

Indiquons enfin que le théorème du Minmax de Von Neumann se généralise au cas où 
les paiements ne sont plus nécessairement réels mais appartiennent à un corps ordonné 
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(et alors la valeur est un élément du corps, Weyl, 1950) : on vérifie que l’ensemble 
défini par l’équation (1) est spécifié par un nombre fini d’inégalités linéaires larges. 

3. Stratégies optimales 

Soit un jeu matriciel défini par une matrice A dans R fxJ . 

On note X(A) (resp. Y (A)) le sous-ensemble de A (7) (resp. A (J)) formé des straté- 
gies optimales du joueur 1 (resp. 2). 

On rappelle qu’un polytope est l’enveloppe convexe d’un nombre fini de points (ce 
qui équivaut en dimension finie à un ensemble borné, intersection d’un nombre fini de 
demi-espaces). 

Proposition 3.1. 

a) X(A) et Y (A) sont des polytopes non vides. 

b) Six e X(A), y eY (A), i G supp (æ) et j G supp (y), alors iAy = v et xAj = v 
( complémentarité ) . 

c) Il existe un couple de stratégies optimales (x*,y*) dans X(A) x Y {A) satisfai- 
sant la propriété de complémentarité forte : 

Vi G 7, (x* 1 > 0 iAy* = v ) et Wj G J, (y* j > 0 x*Aj = v ) . 

d) X(A) x Y(A) est Vensemble des points-selle de A : éléments (x*,y*) de 
A(7) x A( J) tels que : 

xAy*< x* Ay* < x* Ay V(x,ÿ)GA(/)xA(J). 

Preuve : Les démonstrations de a), 5), et d) sont des conséquences élémentaires des 
définitions et du théorème du minmax. La propriété d) est en fait vraie pour tout jeu 
à somme nulle (elle correspond à l’identité entre les couples de stratégies optimales et 
les équilibres de Nash (voir le Chapitre 4) d’un jeu à somme nulle). 

L’assertion c) correspond à la propriété de complémentarité forte en programma- 
tion linéaire et est une conséquence du théorème de l’alternative. ■ 

4. Extensions 

L’extension suivante du théorème de von Neumann est due à Loomis. 
Théorème 4.1 (Loomis , 1946). 

Soient A et B deux matrices réelles I x J, avec B > 0. Il existe (x^y^v) dans 
A(7) x A (J) x E tel que : 


xA>v xB et Ay <v By. 
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Si Bij = 1 pour tout (i, j) G I x J, on retrouve le théorème de Von Neumann. 
Réciproquement, on peut donner une preuve élémentaire du théorème de Loomis à 
partir de celui de Von Neumann : l’application val(A — tB ), est continue 

(strictement décroissante) et a pour limites +oo en — oo, et — oo en +oo. Il existe donc 
un réel v tel que val(;4 — vB) = 0, et il convient. 

Voir l’Exercice 2.1 pour une preuve directe du théorème de Loomis. 

Un exemple d’application du théorème de Von Neumann est le suivant : 

Corollaire 4.2. 

Toute matrice stochastique admet une probabilité invariante. 

Preuve : Soit A une matrice stochastique dans R lxj : I = J, > 0 et Y^jei^ij = 
1 ,Vz G I. Notons B = A — Jd, où Id est la matrice identité, et plaçons-nous dans le 
jeu défini par B. Considérons tout d’abord la stratégie uniforme y* du joueur 2. Elle 
garantit 0, donc la valeur de B est négative. De plus, contre n’importe quelle stratégie 
mixte y du joueur 2, jouer une ligne i telle que y 1 = min jeiy^ donne un paiement 
positif au joueur 1, donc le joueur 2 ne peut pas se garantir une quantité strictement 
négative. Par conséquent la valeur de B est nulle. 

Une stratégie optimale x* du joueur 1 dans B vérifie x*A — x* > 0, et en considérant 
le produit par y* on obtient l’égalité sur toutes les composantes d’ où x*A = x* (ou 
par complémentarité). ■ 

Le théorème de Von Neumann permet de montrer l’existence de la valeur dans 
le cas continu suivant, où A([0, 1]) dénote l’ensemble des probabilités boréliennes sur 
[ 0 , 1 ]. 

Théorème 4.3 (Ville , 1938). 

Soient I = J = [0, 1], et f une fonction réelle continue sur I x J. L’extension mixte 
(A(7), A (J), /) possède une valeur et chaque joueur a une stratégie optimale. De plus , 
pour tout e > 0, chaque joueur a une stratégie e- optimale à support fini. 

(En particulier toute extension mixte du jeu (/, J, /) a la même valeur.) 

Voir l’Exercice 2.3 pour la preuve : on procède par discrétisations de plus en plus fines 
du carré [0, 1] x [0, 1], et on extrait une sous-suite faiblement convergente d’une suite 
de stratégies à support fini. 

L’Exercice 3.7 montre que l’hypothèse / continue n’est pas superflue dans l’énoncé 
du théorème de Ville. 
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5. Exemples 

Exemple 1. 

Ici v = 1/7. Le joueur 1 a une unique stratégie optimale : jouer Haut avec proba- 
bilité 4/7, et Bas avec probabilité 3/7. Le joueur 2 a une unique stratégie optimale : 
jouer Gauche avec probabilité 5/7, et Droite avec probabilité 2/7. 

Exemple 2. 

Quel que soit x, le jeu a une valeur v = 1, et chaque joueur a une unique stratégie 
optimale, qui est pure : Haut pour le joueur 1, Gauche pour le joueur 2. 

Exemple 3. 

Dans le cas général à 2 actions par joueur, soit il existe un couple de stratégies op- 
timales pures (et alors la valeur est un des nombres {a, 6, c, d}) et sinon les stratégies 
optimales sont complètement mixtes et la valeur vaut : 

ad — bc 

v = — . 

a + d — b - c 

6. Fictitious play 

Soit A une matrice réelle I x J. Le processus suivant, appelé fictitious play , a 
été introduit par Brown (1951). Imaginons des joueurs jouant de façon répétée le jeu 
matriciel A. A chaque étape, chacun des joueurs calcule la moyenne empirique des 
actions jouées par son adversaire dans le passé, et joue une meilleure réponse pure 
face à cette moyenne. 

Explicitement, on part de {iuji) arbitraire dans I x J, et à chaque étape n 
on considère x n = ^Ylt= i*t> vu comme un élément de A(J), et de même pour 
Vn = n X^t=i 3t dans A (J). 

Définition 6.1. Une suite (i n ,jn)n > î à valeurs dans I x J est une réalisation d’un 
processus de fictitious play pour la matrice A si : pour tout n > 1, z n +i est une 
meilleure réponse du joueur 1 contre y n dans A, et j n +\ est une meilleure réponse du 
joueur 2 contre x n dans A. 

Théorème 6.2 (Robinson, 1951 ). 

Soit (i n ,jn)n > î une réalisation d’un processus de fictitious play pour la matrice A. 
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Alors la distance entre (x n ,y n ) et l’ensemble des couples de stratégies optimales de A 
tend vers 0, quand n — > oo. Explicitement : 

Ve > 0, 37V, Vn > N,Vx G A(I),Vy G A (J), 

x n .A?/ > val(A) — e et x.Ay n < val(i4) + e. 

De plus le paiement moyen sur la trajectoire, soit ^ Y^t=i Ai L j L) converge vers val(A). 


Nous allons illustrer la preuve en passant en temps continu. 

Prenons comme variables les fréquences empiriques x n et y n , donc la dynamique dis- 
crète s’écrit (pour la composante du joueur 1) : 

‘En-f-l J r(^n-|-l riXf^j 

n + 1 

et satisfait : ^ 

%n -\- 1 — x n £ fi \ [B R ( yn ) — x n\ 

où B B. 1 dénote la correspondance de meilleure réponse du joueur 1 (voir Chapitre 1, 
Section 3). 

Le système analogue en temps continu est alors : 

x(t) € J [BR}(y(t)) - x(t)] . 

C’est une inclusion différentielle qui correspond, avec la condition similaire pour le 
joueur 2, au processus CFP : continuons fictitious play. 

Proposition 6.3 (Harris, 1998; Hofbauer et Sorin, 2006). 

Pour le processus CFP, il y a convergence du saut de dualité vers 0 à la vitesse 1/t. 

Preuve : (Nous supposons l’existence d’une solution au processus CFP). On effectue 
le changement de temps z(t) = x(exp(£)) qui ramène aux inclusions différentielles : 

x(t) e [ BR 1 {y{t)) - x(t)] , et ÿ(t) e [BR?(x(t)) - y(t)] . 

Ceci correspond à la dynamique de meilleure réponse (Gilboa et Matsui, 1991). 
Notons le paiement F(x,y) = xAy , et pour ( x,y ) dans A(7) x A(J), posons 
L(y) = max æ / € A(/) F(x\ y) et M(x) = min y , €A(J) F{x,y'). 

Donc le saut de dualité associé au couple (x,y) est : W(x,y) = L(y) — M(x) > 0 
et le couple (x,y) est une paire de stratégies optimales dans A si et seulement si 
W(x,y) = 0. 

Soit maintenant (x(t),y(t))t> o une solution de CFP. 

On note w(t) = W(x(t),y(t)) l’évaluation du saut de dualité sur la trajectoire, 
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a(t) = x(t) + x(t) e BR}(y(t)) et /3(t) = y(t) + ÿ(t) e BR?(x(t)). 

On a L(y(t)) = F(a(t),y(t )), d’où 

j t L (y{t)) = à(t)DiF{u{t),y(t)) + ÿ(t)D 2 F{a{y),y(t)). 

Le théorème de l’enveloppe (voir par exemple, Mas Colell, Whinston and Green, 1995, 
p. 964) montre que le premier terme est nul et le second terme vaut F(a(t) i y(t)) (par 
linéarité de F par rapport à la seconde variable) . 

On obtient donc : 

m = £mt))-£ M W)) 

= F(a(t),ÿ(t))-F(mm) 

= F(x(t),ÿ(t)) - F(i(t),y(t)) 

= F(x(t),P(t))-F(a(t),y(t)) 

= M(x(t)) - L(y(t)) 

= -w(t). 

soit : w(t) = w(0)e~ £ . Il y a convergence de w(t) vers 0 à vitesse exponentielle, et 
donc convergence vers 0 à vitesse 1/t dans le problème initial avant changement de 
temps. 

La convergence vers 0 du saut de dualité implique par continuité la convergence de 
vers l’ensemble des stratégies optimales. ■ 


Preuve du Théorème 

Remarquons que par compacité des ensembles de stratégies mixtes, on obtient l’exis- 
tence de stratégies optimales dans le jeu matriciel (points d’accumulation des tra- 
jectoires). On retrouve donc le théorème du minmax, à partir de l’existence d’une 
solution au processus CFP. 

Le résultat est en fait plus fort : l’ensemble des stratégies optimales est un attracteur 
global pour la dynamique de meilleure réponse, ce qui implique la convergence de la 
version discrète en temps, donc du processus de fictitious play (Hofbauer and Sorin, 
2006). 

Considérons enfin la somme des paiements réalisés : B. n = Ylp= î F(ipijp)- En posant 
U L = £™= i F (iJk) on obtient 


= E" r J u ï - K-i) = u ï - c: K’" = ai - + - K'*') 


y n— 1 
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mais la propriété de fictitious play implique 


ujr - t/p 7,+1 < 0. 


Donc 


R<n U 1 

limsup — < limsupmax — < val (A) 

n— >oo Tl n—ïoo * Tl 


Iji 

car = F(i,y n ) < val (A) + e pour n assez grand puisque y n tend vers Y {A) par le 
résultat établi précédemment. 

L’inégalité duale implique alors le résultat. 




CHAPITRE 3 


Jeux à somme nulle : le cas général 


On considère ici des jeux à somme nulle généraux. Comme dans le théorème de 
Von Neumann, on appelle théorème de minmax un résultat donnant des conditions 
suffisantes d’existence de la valeur. 

1. Le théorème de Sion 

Le lemme suivant, appelé lemme de l’intersection (voir Berge, 1966, p.172), sera 
utile par la suite. 

I Lemme 1.1. 

Soient Ci,..., C n des convexes compacts non vides d } un espace euclidien. On suppose 
que Vunion \J™ =1 Ci est convexe, et que pour tout j = 1, ...,n, l’intersection H^jCi est 
non vide. Alors l’intersection totale r\™ =1 Ci est non vide. 

Preuve : C’est clair pour n = 1. Soit n > 2, supposons le résultat vrai pour n — 1 
et faux pour n. Soient Ci,..., C n satisfaisant les hypothèses et tels que Hf =1 Ci = 0. 
Alors C n et flJÎT^Ci, noté D n , sont des convexes compacts non vides disjoints. Par le 
théorème de Hahn-Banach on peut les séparer strictement par un hyperplan fermé H. 
Pour i = 1, ...,n — 1, on pose Ci = CiC\H et C = (U JL 1 Ci)flff, qui sont donc convexes 
et compacts. Comme C n fl H = 0 = D n n H, on a = C et = 0. Par 

hypothèse de récurrence appliquée à l’ordre n — 1 aux Ci, il existe j dans {1, ..., n — 1} 
tel que r\i^j }Tl Ci = 0. Posons K = n^j )Tl Q, on a D n C K et C n fl K ^ 0. Comme K 
est convexe et intersecte des ensembles séparés par Phyperplan H, K D H ^ 0. Mais 
K fl H = r\i^j }n Ci = 0, d’où la contradiction. ■ 

Remarque : La preuve n’utilisant que le théorème de séparation stricte de Hahn- 
Banach, le résultat est vrai dans tout espace où ce théorème s’applique (comme les 
espaces vectoriels topologiques localement convexes séparés). 


Avant d’énoncer le théorème de minmax de Sion, on introduit les définitions sui- 
vantes. 
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Définition 1.2. Une application f : E — > R, où E est convexe , est quasi-concave 
si pour tout réel X, la section supérieure large {x e E , f(x) > À} est convexe, f est 
quasi- convexe si — f est quasi- concave. 

D i autre part, si E est un espace topologique , une application f : E — ► R est 

semi-continue supérieurement (s.c.s.) si pour tout réel X, la section supérieure large 
{x G E,f(x) > À} est fermée, f est semi-continue inférieurement (s.c.i.) si —f est 
s.c.s. 

Il est clair que si E est compact et f s.c.s., alors f atteint son maximum sur E. 

Dans les théorèmes suivants, les ensembles de stratégies S et T sont des sous- 
ensembles de M-espaces vectoriels topologiques séparés. 

Théorème 1.3 (Sion, 1958). 

Soit un jeu à somme nulle G = ( S , T, g) tel que : 

(i) S et T sont convexes, 

(ii) S ou T est compact, 

(iii) pour tout t dans T, g(.,t) est quasi-concave s.c.s. en s, et pour tout s dans S, 
g(s,.) est quasi-convexe s.c.i. ent. 

Alors G a une valeur : 


sup inf g(s,t) = inf sup g(s,t). 
s€ s£eT t€T 3 çs 

De plus, si S (resp. T) est compact, les suprema (resp. infima) ci-dessus sont atteints : 
le joueur correspondant possède une stratégie optimale. 

Preuve : Supposons par exemple S compact, et que G n’a pas de valeur. Alors il existe 
un réel v tel que : sup sÇ5 inf* € T#(s, t) <v< inf tG TSup sG5 #(s, t). Et donc : 

Vs e s,3te T, g(s,t) < V , 

\/t eT,3s e S , g(s,t) > v. 

On se ramène au cas où S et T sont des polytopes, puis on applique le lemme de 
l’intersection. 

Posons, pour tout t dans T, St = {s E S , g(s,t) < v}. La famille (St)t^T forme un 
recouvrement ouvert du compact S , dont on peut extraire un sous-recouvrement fini : 
S C UtçToS't, avec T 0 fini. 

L’enveloppe convexe T f = conv (To) est compacte (homéomorphe au simplexe sur 
To, en dimension finie, il n’y a qu’une topologie d’espace vectoriel topologique sé- 
paré) et l’on a encore : sup se5 inf teT'9{s>t) < v car bien sûr S C U teT'St et 
v < inf* e 7 vsup sG5 < 7 (s,£) car l’inf est pris sur un ensemble plus petit. 
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Comme plus haut, la famille ( T' s = {t G T\g(s,t) > u}) se s forme un recouvrement 
ouvert de T'. On peut donc aussi trouver un sous-ensemble fini So de S tel que : 

Vs G conv (So), E3£ G To, g(s,t) < v , 

\/t G conv(To), 3s G S 0 , g(s,t) > v. 

Quitte à enlever des éléments à So et To, on peut supposer sans perte de généralité 
que (So, To) est minimal pour l’inclusion (dans l’ensemble des couples (A, B) où A 
et B sont des sous-ensembles non vides de 5 et T satisfaisant l’analogue des deux 
dernières conditions). 

Pour s dans So, notons maintenant A s = {t e conv(To), g(s,t) < v}. A s est un 
sous-ensemble convexe compact de conv (To). On a n«,es 0 Æ, = 0 et pour tout so dans 
So, n sG s 0 \{ S() }.A s ^ 0 par minimalité de So. Par conséquent, le lemme de l’intersection 
implique que l’ensemble U S €S 0 A S n’est pas convexe. 

Il existe alors to G conv (T 0 )\ U sGl s 0 et donc g(s, to) > v, pour tout 5 G So- Puisque 
<7(.,£o) est quasi-concave, on a également : g(s,to) > v, pour tout s G conv(So). 
On montre de même l’existence de so € conv (So) tel que #(so, £) < pour tout 
t G conv (Tq), d’où la contradiction en évaluant g(so,to). 

L’existence de stratégie optimale vient simplement du fait que S est compact et 
l’application : s h-» inf ie T 9 (s,t) est s.c.s. ■ 

En renforçant l’hypothèse de convexité sur g(s, .), on peut affaiblir les hypothèses 
topologiques. Dans le résultat suivant, on ne considère en fait aucune topologie sur 
T. 

Proposition 1.4. 

Soit un jeu à somme nulle G = (S, T, g) tel que : 

(i) S est convexe compact , 

(U) T est convexe , 

(ni) pour tout t dans T, g(.,t) est quasi-concave s.c.s., et pour tout s dans S, g(s ,.) 
est convexe. 

Alors G a une valeur : sup sG5 inf terg(s,t) = inft € TSup s€5 ^(5,t), et le joueur 1 
a une stratégie optimale. 

Preuve : Supposons qu’il existe un réel v vérifiant : sup se5 inf teT 9 (s,t) < v < 
inf t€ TSup s€5 g(s,t). Comme dans la preuve du théorème de Sion, il est d’abord 
possible de trouver un ensemble fini Tq = {t\,..,tj} C T tel que : Vs G S, 3t G To, 
g(s,t) < v. 

On munit l’espace affine engendré par les éléments de Tq d’une norme, et on note 
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int(conv (To)) l’intérieur relatif de conv(To). Pour tout s dans 5, g(s , .) est convexe, 
donc est continue sur int(conv (To)) (une fonction convexe définie sur un ouvert d’un 
espace euclidien y est continue, voir par exemple Berge (1966), Théorème 7, p. 203). 
Fixons to dans int(conv (To)) et posons pour tout n > 1 et j G {1,.., J} : t ™ = 
^to + (1 — ^ )tj et SJ* = {s G S, g(s ) t™) < v}. Pour tous j 9 n, par convexité de g(s , .), 
on a g(s , t™) < ^#(s, t 0 ) + (1 — ^)#(s, tj). Donc les ensembles SJ* forment un recouvre- 
ment ouvert de S. On peut donc trouver un sous-ensemble fini T\ de int(conv (To)) 
tel que : 

Vs G S, 3te Ti, g(s 9 t) < v , 


Vt G conv (Ti), 3s G S, g(s ) t ) > v. 

Maintenant, puisque g(s ) .) est continue sur conv (Ti) pour tout s dans S et que #(., t ) 


est s.c.s, 


max min 

sÇ:S £€ conv (Ti) 


g(s,t) 


< min ma xq(s y t). 

t € conv (Ti) 


Ceci contredirait le théorème de S ion, et donc G a une valeur. 

Comme précédemment, l’application : s i— >• inf terg(s,t) étant s.c.s., le joueur 1 a une 
stratégie optimale (mais pas nécessairement le joueur 2). ■ 


2. Théorèmes de minmax en stratégies mixtes 

On considère ici des jeux sans hypothèse de convexité sur les espaces de straté- 
gies. On est amené à convexifier un ensemble X soit en prenant A /(X), l’ensemble 
des probabilités sur X à support fini (c’est convX l’enveloppe convexe de X) y soit 
dans le cas topologique ( X métrique compact) en considérant A(X) l’ensemble des 
probabilités Boréliennes sur X. Rappelons que dans ce cadre A(X) est muni de la 
topologie faible * (/x n converge ^-faiblement vers /x si f x <j) d/x n -> J x (j) d/i pour toute 
fonction réelle 0 continue sur X). Alors A(X) est lui- même compact métrique et si 0 
est s.c.s. sur X, <p : /x f x (j) dfjb est s.c.s. sur A(X), (Billingsley, 1999 ; Parthasarathy, 
1967). 

On peut tout d’abord montrer le résultat suivant à l’aide de la proposition 1.4. 

Proposition 2.1. 

Soit un jeu à somme nulle (5, T, g) tel que : 

(i) S est un espace topologique métrique compact , 

(ii) pour tout t dans T, g{.,t) est s.c.s.. 

Alors le jeu (A(5), A/(T),^) a une valeur et le joueur 1 a une stratégie optimale. 

Preuve : Il suffit de remarquer que si S est compact et g(.,t) s.c.s., alors A (S) est 
compact et a g(cr,t) = f s g(s,t)a(ds) est s.c.s.. 
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Par ailleurs g{(J,r) est bien définie sur A (S) x A f(T) et est bilinéaire. Donc les condi- 
tions de la Proposition 1.4 s’appliquent. ■ 


Le théorème suivant est le théorème de minmax classique en stratégies mixtes. 
On suppose la fonction de paiements bornée (et mesurable) afin de pouvoir appliquer 
le théorème de Fubini et ainsi définir l’extension mixte du jeu. 


Théorème 2.2. 

Soit un jeu à somme nulle G = (S, T, g) tel que : 

(i) S et T sont métriques compacts, 

(ii) pour tout t dans T, g(.,t) est s.c.s ., et pour tout s dans S, g(s , .) est s.c.i. 

(iii) g est bornée et mesurable par rapport à la tribu Borélienne produit 

Alors V extension mixte de G a une valeur. Chaque joueur a une stratégie optimale 
mixte, et pour tout e > 0, chaque joueur a une stratégie e-optimale à support fini. 


Preuve : On applique la Proposition 2.1 respectivement aux jeux G + = (A(5), Af(T),g) 
et G~ = (Af(S),A(T),g) qui induisent des valeurs v + et v~ avec bien sûr v~ < v+. 
Soit a (resp. r) une stratégie optimale pour 1 dans G + (resp. 2 dans G~). On obtient : 


D’où en utilisant le théorème de Fubini : 


J g(s,t)a(ds) > v + , Wt G T 

J g(s,t)r(dt) < v~, Vs G S. 
ne de Fubini : 

< I / g(s,t)a(ds)r(dt) < v~ 

J JSxT 


et le résultat suit. 


3. Convexité 

Les résultats du paragraphe précédent peuvent être également obtenus à partir 
d’un théorème de séparation en dimension finie. 

Proposition 3.1. 

Soit un jeu à somme nulle (S, T , g) tel que : 

(i) S est un espace mesurable et X un ensemble convexe de probabilités sur S, 

(U) T est fini, 

(iii) g est mesurable et bornée. 

Alors le jeu (X,A (T), g) a une valeur. 
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Preuve : Soit y = sup^ infr #( æ> t) et D = {a G IUT : 3x G X,g(x,t) = 
f x g( s ,t)x(d s ) = a*,V£ G T}. On note que D est convexe et a une intersection vide 
avec le convexe C = {a G 1R T ; a* > y + e ) \/t G T}, pour tout £ > 0. 

Par le théorème de séparation faible (en dimension finie) on en déduit l’existence d’un 
vecteur b G 1R T , non nul et tel que : 

(M) < (M, Vc G C,Vd G .D. 

C est positivement compréhensif d’où b > 0 et en normalisant on obtient y G A (T) 
avec : 

s(*.y) = £ t / s #(s, t)x(ds)y t <y + £> Va; G X. 

Donc v < v + £, V£ > 0, d’où l’égalité et par compacité l’existence d’une stratégie 
optimale pour 2. ■ 


4. Opérateur valeur et jeu dérivé 

Fixons ici les ensembles de stratégies S et T et considérons un ensemble T de 
fonctions réelles définies sur S x T, tel que : 

T est un cône convexe ( T est stable par addition et mutliplication par un réel positif, 
et 0 G J r ), 

et pour tout / dans T le jeu (5, T, /) a une valeur notée valsxr(f) ou plus simplement 
val(/). 

Clairement, l’opérateur val est : 

1) monotone : / < g => val (/) < val(#), et 

2) il translate les constantes : Vt G IR, val(/ + t) = val (/) + t. 

On en déduit facilement : 

Proposition 4.1. 

L 1 opérateur val est non dilatant : 

|val (/) - val(ÿ)| < ||/ - glu 
(avec \\f - g\\oo =def sup S xT\f(s,t) - g(s,t)\). 

La proposition suivante étend la version du cas fini, due à Mills (1956). 
Proposition 4.2 (Rosenberg and Sorin, 2001). 

Soient S et T des métriques compacts, f et g des fonctions réelles définies sur S xT. 
On suppose que pour tout a > 0, les fonctions g et f + ag sont s.c.s. en s et s.c.i. en 
t, et que le jeu ( S , T, / + ag) a une valeur vals X T(/ + (xg ). Alors 

lim - [vals x r(/ + ag) - val SxT (/)] existe 
a— >0+ a 
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et cette limite vaut : 

val S (f)xT(f)(g), 

où S(f ) et T(f) sont les ensembles des stratégies optimales dans le jeu (5, T,/). 

Preuve : Les hypothèses impliquent l’existence de s a G S(f + ag) et de t G T(/). On 
a : 

ag(s a> t) = [/ + ag](s a ,t) - f(s a ,t ) > val SxT (/ + ag) - val 5xT (/). 

Donc : 

inf g(s a , t)>- [val SxT (/ + ag) - val Sx T(/)] 

j (/) Oi 

et 

limsup inf g(s a , t) > limsup - [val SxT (/ + ag) - val Sx r(/)] • 
a _y 0 + T(f) a— >o+ a 

Soit s* un point d’accumulation de la famille s a quand a tend vers 0 sur une suite 
réalisant la limsup. Puisque g est s.c.s. en s 

inf g(s, t) > lim sup inf g(s a , t). 

T{f) a— >0+ ■* (/) 

On note que s* G S(f) (S est compact et / + ag s.c.s. en s) d’où : 

sup inf a(s y t) > limsup - [val 5xT (/ + ag) - val sxr(f)] 

S(f)TU) a— >0+ Oi 

et le résultat suit par une inégalité duale. ■ 

Le jeu (S(f)>T(f),g) est appelé jeu dérivé de / dans la direction g. 




CHAPITRE 4 


Jeux à n joueurs : rationalité et équilibre de Nash 


1. Notations 

Soit G = (AT, (5*)i € yv> un jeu sous forme stratégique. N est l’ensemble des 

joueurs (de cardinal noté N s’il n’y a pas de confusion). 5 Z , i e N, est l’ensemble des 
stratégies (pures) du joueur i. On suppose que 5 Z est un sous ensemble d’un espace 
vectoriel topologique localement convexe et séparé, g 1 : S = es ^ 

fonction de gain du joueur i, qui est supposée bornée, \/i G N. 

G est compact (resp. fini, de dimension finie) si les 5 Z le sont pour tout i e N. 

G est continu si les g z le sont pour tout i e N. 

G est quasi- concave si les S 1 sont convexes et les g 1 sont quasi-concaves en S % pour 
tout i e N. 


2. Dominance 

On considère ici un jeu fini et son extension mixte. 

On rappelle qu’une stratégie s z G 5 Z est strictement dominée s’il existe cr z G A (S 1 ) tel 
que pour tout t~ % G 5 _z , g l {(J l ,t~ l ) > g l (s l ,t~ l ). 

Une stratégie s % n’est jamais meilleure réponse à une stratégie mixte s’il n’existe pas 
r~ % G Tlj^iA(S^) } tel que s z G 

Une stratégie corrélée de — i est un élément 6 G A(5 _z ). (Noter que 9 n’est pas 
un vecteur produit). Le paiement correspondant est défini dans ]R. N par g(s l , 0l“ z l) = 
Xl s -i0[ -z l(s -z )<7(s z , s _z ). Une stratégie s 1 n’est jamais meilleure réponse à une straté- 
gie corrélée s’il n’existe pas 0l _z l G A (5 -z ) tel que s 1 G jBi?, z (0l -z l). 

Dès qu’il y a trois joueurs ou plus, une stratégie peut être une meilleure réponse à 
une stratégie corrélée sans être une meilleure réponse à une stratégie mixte : 
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Dans le jeu ci-dessus le joueur 1 choisit T ou Æ, le joueur 2 L ou i?., le joueur 3 
M 2 , i = 1, ...,4 et les paiements sont ceux du joueur 3. M 2 est une meilleure réponse 
du joueur 3 à \{TL) + \ {BB) mais n’est meilleure réponse à aucune stratégie mixte 
de { 1 , 2 }. 

Proposition 2.1. 

s 1 est strictement dominée si est seulement si elle n’est jamais meilleure réponse à 
une stratégie corrélée de —i. 

Preuve : Soit s 2 strictement dominée et cr l G A {S 1 ) tel que pour tout t~ l G 5 -2 , 
g l {(j l ,t~ % ) > g l (s l ,t~ l ). Par linéarité, on déduit que < 7 2 (cr 2 , 0 [ _ 2 1) > g‘ l (s‘ l ) 9 l - 2 l) pour 
tout 01-*] G A (S-*) : s 2 ne peut être meilleure réponse à une stratégie corrélée. 

Inversement, supposons que s 2 ne soit jamais meilleure réponse à une stratégie 
corrélée. Considérons l’extension mixte du jeu matriciel H à deux joueurs et à somme 
nulle où le joueur i a comme ensemble de stratégies pures S % et joue contre l’équipe 
des joueurs — i (pris comme un joueur) ayant comme ensemble de stratégies pures S~ l . 
La fonction de paiement de i dans H est h l {t l ,t~ l ) = g x {t x % t~ % ) - g l {s % ,t~ % ). Puisque 
s 2 n’est jamais meilleure réponse à une stratégie corrélée dans G, la valeur de H est 
strictement positive. Toute stratégie mixte optimale cr 2 du joueur i dans H dominera 
strictement s 2 dans G. ■ 


Une stratégie s 2 n’est jamais meilleure réponse à une stratégie complètement cor- 
rélée s’il n’existe pas 9^~^ G int{A(S~ 1 )) (i.e. telle que 0[ _ 2 )(s _2 ) > 0, Vs _z ) tel que 
a* G 


I Proposition 2.2. 

s 1 est faiblement dominée si et seulement si elle n’est jamais meilleure réponse à une 


Preuve : Si s 2 est faiblement dominée alors il existe a 1 G A (S 1 ) tel que pour tout 
t~ % G 5 -2 , g l (cr l ,t~ l ) > g l (s <l y t~ l ) avec au moins un cas où l’inégalité stricte. Par 
linéarité, on déduit que 0 2 (<r 2 , 0l - 2 l) > g l {s % ^9^~^) pour tout 9^~ l 1 G int(A(S~ x )) : s 2 
ne peut être meilleure réponse à une stratégie complètement corrélée. 

Supposons que s 2 ne soit pas meilleure réponse à une stratégie complètement cor- 
rélée. Considérons le jeu matriciel H comme dans la preuve précédente. Le joueur i 
peut garantir 0 dans H en jouant s 2 , sa valeur est au moins 0. 

Si la valeur est strictement positive, toute stratégie optimale dans H domine stric- 
tement s 2 dans G ce qui implique que s 2 n’est pas meilleure réponse à une stratégie 
corrélée. 
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Supposons maintenant que la valeur soit zéro, impliquant par là même que s x est op- 
timale dans H. Puisque s % n’est pas meilleure réponse à une stratégie complètement 
corrélée, aucune stratégie optimale de l’équipe — i ne peut être à support plein. (Rap- 
pelons que dans tout jeu fini à somme nulle, l’ensemble des stratégies optimales d’un 
joueur est convexe et qu’une stratégie pure est utilisée dans une stratégie optimale si 
et seulement si cette stratégie est optimale contre toutes les stratégies optimales de 
l’opposant (Chapitre 2, Proposition 3.1. c)). Soit t~ l G S~ l n’appartenant au support 
d’aucune stratégie optimale de — i. Il existe donc une stratégie a % (optimale pour i 
dans H) face à laquelle t~ l G S~ l n’est pas une meilleure réponse. Cela signifie que 
pour tout s~ % G S ~ % , , s~ l ) > 0 et /i*(cr\ t~ l ) > 0. Donc o x domine faiblement s x 

dans G. ■ 


3. Rationalisabilité 

Une stratégie s 1 qui n’est jamais meilleure réponse ne peut pas être jouée par un 
joueur qui maximise face à un profil de stratégies de ses adversaires : on dit qu’elle 
n’est pas justifiable. En particulier, une stratégie strictement dominée n’est pas justi- 
fiable. 

Définissons inductivement l’ensemble des stratégies justifiables à l’étape 1 par : 

S l ( 1) = BB X (S~' 1 ) = {s 1 ; G S~ l , s 1 est une meilleure réponse à s - *}, Vz G N , 

puis S x (k + 1) = BB x (S~ l (k)). En passant de S(k) à S(k + 1), la procédure élimine les 
stratégies qui ne sont jamais meilleure réponse aux stratégies qui restent justifiables 
à l’étape k. On obtient une suite décroissante de limite T 1 = r\kS x (k). Soit T = 

Les éléments de T sont les stratégies rationalisables. 

Proposition 3.1 (Bernheim, 1984; Pearce, 1984). 

Soit G un jeu compact et continu. Alors T est un compact non vide , point fixe de B B.. 
C’est le plus grand ensemble L C S tel que 

L C BB{L). 

Preuve : La continuité du jeu implique la semi-continuité supérieure de la correspon- 
dance B B. et puisque le jeu est compact, chaque S(k) est compact. On obtient ainsi 
une suite emboîtée de compacts non vides qui converge vers T compact non vide. Par 
ailleurs T C S(k + 1) = BB,(S(k)). Donc T C lim B B.(S (k)) C BB.(T). Enfin 
T C S (k) implique BB{T ) C BB.(S(k)) = S(k + 1). En passant à la limite on déduit 
que BB(T) C T. 

Soit maintenant L tel que L C BB.(L). Puisque L C S et L C BB.(L) nous ob- 
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tenons, L C BR(S) = S( 1). Inductivement, L C S(k) et L C BR.(L) impliquent 
L C BR(S(k)) = S (h + 1). En passant à la limite nous en déduisons que L G T. 

■ 

Remarques 

- La Proposition 2.1 montre le lien de cette procédure avec l’élimination itérée de 
stratégies strictement dominées. 

- Il est par ailleurs instructif de préciser les hypothèses sur les connaissances des 
joueurs (sur l’état et sur le monde) pour établir le fait qu’ils puissent se livrer à cette 
réduction à des stratégies rationalisables. 

- On pourra comparer aux orbites de trajectoires de meilleure réponse dans le cadre 
de jeux d’évolution. 


4. Equilibre de Nash 

I Un équilibre (de Nash) est un profil de stratégies s € S où aucun joueur ne gagne 
en déviant de manière unilatérale. Autrement dit, pour chaque joueur à, s’il pense 
que les autres vont suivre le profil s~ l alors il est rationnel pour lui de jouer selon la 
composante s \ 

Un jeu peut avoir plusieurs équilibres non-interchangeables (à la différence fonda- 
mentale des jeux à somme nulle). Ce concept a eu un impact considérable en économie 
mais aussi en biologie, science politique, informatique, recherche opérationnelle, intelli- 
gence artificielle et bien d’autres domaines d’applications. Par ailleurs l’interprétation 
de la notion d’équilibre de Nash a donné lieu à une littérature imposante. L’équilibre 
de Nash est considéré ici comme une condition mathématique de cohérence qu’il s’agit 
de comprendre et d’étudier. 

Définition 4.1. Soit e > 0. Un e-équilibre est un profil s G S tel que pour tout i y 
s 1 G j B i?4(s -2 ), soit : 

<£*(*)+£, WeS\ Vi. 

On note BR. : S =4 S> la correspondance de meilleure réponse globale qui à, s e S 
associe n ieJV *#(*-*). 

Définition 4.2. s est un équilibre (de Nash) si s e BR(s). 

Un équilibre est strict si {s} = BR.(s). 

Quand BR(-) est réduite à un singleton, c’est une fonction. Dans ce cas, tous les 
équilibres de Nash sont stricts et trouver un équilibre revient à trouver un point fixe 
d’une fonction. 
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5. Cas fini 

On rappelle que l’extension mixte d’un jeu fini G est le jeu où l’ensemble des 
stratégies du joueur i est E* = A ( S 1 ) , l’ensemble des probabilités sur l’ensemble fini 
S % et son paiement est 

g l ((j) = T TT a*(s?)g x (s). 

Un équilibre (mixte) du jeu G est un équilibre de l’extension mixte de G. 

Lemme 5.1. 

a est un équilibre d’un jeu fini G si et seulement si pour tout i et tout s* G S t , 

g l (s l ) a~' 1 ) < ma xg t (t l y a~ t ) => a l (s 1 ’) = 0. 

£*€ S* 

Preuve : Puisque g l (o-' l y cr~' L ) = G est un équilibre de G si et 

seulement si pour tout i, 

g\a l ,a~^ = ma x $*(**, <r“ 4 ). 

Donc g l (s l , a~ l ) < ma x t i eS i g l (t l , cr~ l ) implique cr l (s l ) = 0. ■ 


Le théorème fondamental est le suivant. 

Irhéorème 5.2 (Nash, 1950). 

Tout jeu G fini admet un équilibre (mixte). 

Preuve : Soit / l’application de Nash de E = YlieN ^ vers ^ définie par : 

, r = g*(g*) + toViO - g*(g)) + 

J{ ,K ’ l + ^s<9 i {t\a-<)-g^a))+ 

avec a + = max(a, 0). Cette application est bien définie et à valeurs dans E : 

/(^(s*) > o et - 1. 

Puisque / est continue et que E est convexe et compact (comme produit de N en- 
sembles convexes et compacts), le théorème de Brouwer 10.4 implique qu’il existe 
a G E tel que f(a) = a. 

Un tel a est un équilibre de Nash. En effet, fixons un joueur i. Si £'t i €S i (<7 î (^> <T z ) — 
g l (cr)) + = 0 alors g t (a t ) a~ t ) > max^s» #*(£*, a~ l ) : le joueur i joue une meilleure 
réponse face aux autres joueurs. Sinon, T, t i e s i (g t (t 7, ^~ 7 ') — <7 z ( a )) + > 0- Mais comme 
il existe s 7, avec a t (s t ) > 0 et g l {s l , a~ l ) < g % ((j) on obtient : 


1 + Eties^fr 4 ,^ -4 ) “ 9Kv)) + 
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d’où <7 z (s z ) = 0 et la contradiction. 

Réciproquement tout équilibre est un point fixe de / car toutes les quantités 
(g x (t x i cr~ l ) - <7 z (o'))+ sont milles. ■ 

Le jeu G a une symétrie </> si : (1) </> permute les joueurs et si j = <£(z), 0 induit une 
permutation de S 1 sur S i avec (2) pour tout i G N et tout s G S, = g 1, (s). 

Une telle permutation </> génère naturellement une application opérant sur E : si 
j = (j)(i ) et a G E alors </>(<?)* (<l>(s % )) = a 

Théorème 5.3 (Nash, 1950). 

Un jeu fini G de symétrie <f admet un équilibre mixte g de symétrie (j) (a = 0(cr ) ). 

Preuve : Soit X C E le sous ensemble des profils de stratégies mixtes symétriques ( a 
dans E telle que a = (/>{g)). 

X est non vide car le profil où tous les joueurs jouent uniformément est symétrique 
et donc dans X. X est fermé et convexe car si a et r sont dans X alors, 

a + T _ a 1 + T 1 a N + r N 

2 “ t 2 2 ^ 

l’est aussi. L’application de Nash / préserve par définition la symétrie ( f(X ) Ç X). 
Le Théorème de Brouwer implique donc l’existence d’un équilibre symétrique. ■ 

6. Extensions 

I Théorème 6.1 (Nash, 1951, Glicksberg , 1952). 

Si G est un jeu compact , quasi- concave et continu, alors l’ensemble des équilibres de 
Nash de G est fermé et non-vide. 

Si G est un jeu compact et continu son extension mixte a un équilibre. 

Preuve : La quasi-concavité de G implique que pour tout s , BR{s) est convexe. La 
continuité et la compacité de G assurent que pour tout s , BR(s) est non-vide, est 
compact et que le graphe de BR. est fermé : s n s et g t (s n ) > g l (t % , s~ % ),\/t % G S % im- 
pliquent g 1 (s) > g % (t % ,s~ % ), s it' L G S 1 (l’hypothèse de continuité jointe est ici cruciale). 
Le théorème de Ky Fan (Section 10) s’applique donc à la correspondance F = BR 
d’où : l’ensemble des équilibres de Nash de G est fermé et non vide. 

Si G est un jeu compact et continu son extension mixte l’est également (en utilisant 
par exemple le théorème de Stone-Weierstrass) et est multilinéaire. On utilise alors le 
résultat précédent. ■ 
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Remarquons que si les g 1 sont strictement quasi-concaves pour tout z, tous les 
équilibres de Nash sont stricts car, dans ce cas, les ensembles BR(s) sont réduits à 
des singletons pour tout s. 

Application : Cournot a introduit et appliqué plus d’un siècle avant Nash la notion 
d’équilibre stratégique. Considérons un exemple de duopole de Cournot, où chaque 
firme, z = 1,2, choisit de produire une quantité qi G [0, 100], sans connaître, lors de 
sa décision, le montant produit par son adversaire. La fonction de coût de la firme z 
est Ci(qi) = 10<fc, et le prix de vente p qui résulte de la production totale q = qi + q^ 
est p = 100 — q. La stratégie d’une firme consiste donc à choisir q^ et son profit est : 

9\q l , q 2 ) = P X Qi - Ci(qi) = (90 - (çi + q 2 )) q t . 

Ces fonctions sont continues et concaves et les espaces de stratégies sont compacts 
et convexes, il existe donc un équilibre de Nash (dit de Cournot). Il est facile de 
voir que cet équilibre ne peut être sur le bord : qi = 0 => qj = 45 => qi = ^ et 
qi = 100 => qj = 0 =>• qi = 45. Donc l’équilibre est intérieur. Etant donné que la 
fonction de paiement du joueur z est concave et différentiable, les conditions d’op- 
timalité du premier ordre sont nécessaires et suffisantes. Nous déduisons donc que 
BR}{qj) = 90 ~ q - j . Les conditions d’équilibre sont alors : q\ = - 9Q ~^ et <72 = 90 ^- qi . 
L’équilibre de Cournot-Nash de ce jeu est par conséquent q x = q 2 = 30. 

7. Le théorème de Reny 

Plusieurs exemples standards en économie comme le jeu de compétition en prix 
de Bertrand, les jeux de timing, les enchères, la guerre d’usure ou la course au brevet 
ne sont pas des jeux continus. Reny (1999) a pu étendre le théorème d’existence et 
couvrir aussi le cas discontinu dans un cadre topologique assez général. 

I Définition 7.1. Le joueur i peut sécuriser le paiement réel a à s e S, s’il existe 
s 1 G S* tel que < 7 z (s\ s“ z ) > a pour tout s~ l dans un ouvert U contenant s~ l . 

Le graphe de G est l’ensemble j(s, z) G S x 1R N \ z = #(s) j. On note T la ferme- 
ture du graphe de G. 

I Définition 7.2. Le jeu G est robuste ( u better-reply secure ”) si pour tout {s^z) dans T 
où s n’est pas un équilibre de Nash , il existe un joueur i qui peut sécuriser un paiement 
strictement plus élevé que z 1 . 

Un jeu continu est nécessairement robuste mais l’inverse est faux : le jeu de Ber- 
trand ou l’enchère au premier prix sont robustes mais ils ne sont pas continus. 
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Théorème 7.3. (Reny, 1999) 

Si G est un jeu compact , quasi-concave et robuste , V ensemble des équilibres de Nash 
de G est fermé et non-vide. 

Preuve : Pour chaque joueur i et tout s G 5, on introduit : 

£*(s) = sup _inf g\s\ s -i ) = lim inf g\s \s~ i ) 

U3s- i & s^-ts-* 

où le sup est pris sur tous les voisinages de s~ % . Puisque gjf (s\ •) est s.c.i. en s~ l , 
on en déduit que s est un équilibre de Nash s’il existe z tel que (s,z) G T et pour 
tout joueur i, sup s i eSi g î (s î J s~ t ) < z\ En effet si s n’est pas un équilibre, il existe un 
joueur i qui peut sécuriser a 1 > z % , ce qui implique : 

sup g l (s l ,s~ t ) > a 1 . 
s i €S i ~ 

Etant donnés (s, t) G 5x5, on introduit g( s, t) = (^(s 1 ,^ -1 ), ...,g N (s N ,t~ 

et E(s) = {(t,h) gT : g(s,t) < h} . Ainsi un équilibre de Nash existe dès que 
fl 3 esE(s) est non vide. 

Puisque chaque g 1 est bornée, T est un ensemble compact. Par ailleurs g % {s l ,t~ t ) 
est s.c.i. en t~ % , donc g(s , t) est aussi s.c.i. en t, d’où E(s) est compact pour tout s. Il 
suffit donc de montrer que C\ 3e FE(s) est non vide pour tout ensemble F fini ou d’une 
manière équivalente, 3 (s,z) G T tel que g(s, s) < z pour tout s G F. 

Posons F = {si, ..., s m }. Soit 5 q = {s \, ..., s^} et soit conv5g l’enveloppe convexe 
de 5J (de dimension finie). Le polytope conv 5 q est compact. Par conséquent, gf (s*, •) 
est s.c.i. sur n^i conv ^o- 

Nous avons besoin du lemme d’approximation suivant (pour la preuve duquel 
nous renvoyons à Reny, 1999). 

Lemme 7.4. 

Soit T compact métrique et f : T -ï IR. semicontinue inférieurement. Il existe une 
suite de fonctions continues f n :T — ► IR. telles que, pour tout t G T : 

(i) fn(t) < /(*)■ 

(ii) Vt n — > t : lim inf n /„(£„) > f(t). 

En particulier, pour tout s* € Sq, il existe une suite de fonctions g l n (s*, •) sur 
conv Sq, continues sur cet ensemble (métrique, convexe et compact), et telles 
que pour tout s~ l e Yij^i conv Sq : 

(O 3n( s< > s-< ) — £*( si > s_< )- 

(ii) Vs" 4 -> : liminf^^s" 4 ) > ^(«‘.s -4 ). 
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Construisons maintenant une suite de jeux G n . L’ensemble des stratégies du 
joueur i dans G n est A (5 q). Pour chaque /i G (^o) » fonction de gain 

du joueur i dans G n est 


/n(M) = E si€ s^^,5->V) 


où P = ^2 s j€S j £ conv Sq. Le jeu G n satisfait aux hypothèses du théorème 

de Nash-Glicksberg, il admet donc un équilibre de Nash \i n (et s n associé). Pour tout 
i et tout s* tel que li l n (s l ) > 0 et pour tout s 1 G Sq : 

0n(3V -i ) < fn (/O = tfnfaSÔ < < g^S^S^). 


Les premières inégalité et égalité sont une conséquence du fait que fi n est un équi- 
libre et que la fonction de gain (/z\ /i -2 ) est linéaire en fi % (et que donc tout s 1 tel 
que /^(s 1 ) > 0 doit être optimal pour le joueur i face à fjb~ l dans G n ). La deuxième 
inégalité résulte de (i) dans le lemme précédent. 

En intégrant par rapport à fi n et en utilisant la quasi-concavité de g 1 en nous 
déduisons que pour tout i et tout s 1 G Sq : 

^ /n(Mn) < 


Sans perte de généralité et utilisant la compacité, on peut supposer que s n — > s et 
que g l (s n ) — > z 1 . D’où, pour tout s G F, 

g (Si,s~i) < lim inf g^Çs 1 , s~ l ) < z \ 

— 1 n 

où la première inégalité est une conséquence de (ii). ■ 

Ce résultat permet d’obtenir une condition plus directe sur les fonctions de paie- 
ment qui étend les conditions du théorème de Sion (1958) à plusieurs joueurs. 


Définition 7.5. Un jeu G est réciproquement- s. c. s. si pour tout ( s,z ) dans F : si 
g(s) < z alors g(s) = z. 


C’est le cas si, par exemple, la somme des fonctions de paiement est s.c.s. ou 
constante. 


Corollaire 7.6 (Extension de Sion). 

Si G est compact , quasi-concave et réciproquement- s.c.s. et si, pour tout i et tout s 1 , 
g l (s l , .) est s.c.i. en S“* alors le jeu possède un équilibre de Nash. 

Preuve : Il suffit de montrer que le jeu est robuste. Soit (s, z) dans F et supposons 
que s ne soit pas un équilibre. Reciproquement-s.c.s. implique que gi (s) > z pour au 
moins un joueur i ou gi (s) = 'z pour tout joueur i. Dans le deuxième cas, puisque s 
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n’est pas un équilibre, il existe i et P tel que gi (s*, s~ l ) > z 1 . Cela est vrai dans le 
premier cas aussi (prendre s 1 = s z ). Enfin, la semicontinuité inférieure de g % en s~ % 
implique que {s“ z : gi (3% s~ % ) > gi (s*, s~ z ) — ej est un ouvert. Donc le joueur i peut 
sécuriser gi (s*,s” z ) — e > z. Le jeu est par conséquent robuste. ■ 

Pour l’extension mixte on a le résultat suivant. 

Corollaire 7.7 (Reny, 1999). 

Soit G compact avec des fonctions de paiement mesurables et bornées. Si V extension 
mixte de G est robuste alors ce jeu possède un équilibre de Nash (mixte). 

Preuve : L’extension mixte vérifie les hypothèses du théorème de Reny car A (S 1 ) est 
compact et la quasi-concavité des fonctions de paiements vient de la linéarité. ■ 
L’extension mixte d’un jeu continu est continue et donc robuste. Par ailleurs, 
certains jeux peuvent être robustes alors que leur extension mixte ne l’est pas, et 
inversement. En passant à l’extension mixte, il devient à la fois plus facile et plus 
difficile pour un joueur de sécuriser un paiement. Plus facile car ce joueur a plus de 
stratégies, ce qui tend à augmenter le paiement qu’il peut sécuriser. Plus difficile car il 
doit sécuriser face à un ensemble de perturbations plus grand, ce qui tend à diminuer 
le paiement à sécuriser. 

Il peut s’avérer difficile de vérifier que l’extension mixte d’un jeu est robuste, d’où 
la condition plus directe suivante. 

Corollaire 7.8 (Extension de Sion en mixte). 

On suppose que G est compact et séparable , que les fonctions de paiement sont mesu- 
rables et bornées , que pour tout i , et tout s z , g' l (s ' l ) .) est s.c.i. en s~ l et que V extension 
mixte de G est réciproquement- s. c. s. alors le jeu possède un équilibre de Nash mixte. 

Preuve : L’extension mixte satisfait aux conditions du Corollaire 7.6 car l’extension 
mixte du paiement de chaque joueur reste s.c.i. par rapport aux stratégies des autres 
joueurs. ■ 


8. Semi-algébricité 

On se place ici dans le cadre des jeux finis. Chaque 5*, i e N, est un ensemble 
fini, de cardinal ra\ On pose m = Il im l . Un jeu est alors identifiable à un point de 
M Nm . Par exemple, dans le cas de 2 joueurs avec 2 stratégies chacun, on obtient un 
jeu g e E s : 


T 

B 


L R. 


(^i,a2) 

(«3) «4) 

(û-5, ao) 

( 0 , 7 , as) 
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Proposition 8.1. 

L f ensemble des équilibres en stratégies mixtes est défini par une famille finie d’inéga- 
lités polynomiales larges. 

Preuve : a est un équilibre ssi : 

5 Z si€S i *V) -1 = 0, <rV) > 0, Ws i € S i ,\/i G N, 

et 

«V) = les nV(*V(») > <* € S*,Vi 6 AT, 

les inconnues étant les cr t (s î ). ■ 

On utilise ici l’aspect multilinéaire pour comparer les paiements uniquement dans le 
cas de déviations pures, qui sont en nombre fini. 

Un sous-ensemble de JR K est semi- algébrique si c’est une union finie d’ensembles 
de la forme { x : Pk(x) > 0 , Vfc = 1, r} où chaque Pk est un polynôme. Les ensembles 
semi-algébriques ont beaucoup de propriétés structurelles. 

Théorème 8.2. 

Un ensemble semi- algébrique possède un nombre fini de composantes connexes. 

Preuve : Pour une preuve et d’autres résultats, nous renvoyons à Benedetti et Risler 
(1990). ■ 

Corollaire 8.3. 

L’ensemble des équilibres en stratégies mixtes d’un jeu fini est une réunion finie d’en- 
sembles connexes semi- algébriques (i.e. composantes connexes d’équilibres ). 


T 

B 


LMB. 


( 2 , 1 ) 

( 1 , 0 ) 

( 1 , 1 ) 

( 2 , 0 ) 

( 1 , 1 ) 

( 0 , 0 ) 


Pour le jeu suivant 
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on obtient : 



Considérons le jeu (Kohlberg et Mertens, 1986) : 



L 

M 

R. 

T 

(1,1) 

(o,-i) 

(-1,1) 

m 

(-1,0) 

(0,0) 

(-1,0) 

B 

(1,-1) 

(0,-1) 

(-2,-2) 


Il y a une seule composante connexe d’équilibres qui est de la forme 


L M R 






et donc homéomorphe à un cercle (dans l’espace des stratégies). 

Chaque point est limite d’un équilibre d’un jeu proche : par exemple, avec e > 0, le 
jeu 


T 

m 

B 


LMB. 


( M -*) 

(*,- l ) 

(- 1 - 6 , 1 ) 

(- 1 ,-*) 

(-£,£) 

(—1 + e, —e) 

(1 — e > — 1 ) 

( 0 ,- 1 ) 

(- 2 ,- 2 ) 
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a comme unique équilibre {e/(\ + e), 1/(1 4- £),0); (0, 1/2, 1/2). 

9. Développements et exemples 

9.1. Paiements possibles et point de menace. 

Soit G un jeu fini. On introduit les notions suivantes. Le niveau individuellement 
rationnel pour le joueur i est 

V i = min max G i (t i ) t~ l ) 

et le point de menace est V. (Comparer au paiement garanti, Chapitre 2, Définition 
1.2, voir Exercice 2.2). L’ensemble des paiements possibles dans le jeu en un coup 
est Pi = {x G iR n ;3s G S, G{s) = x} et A = {x G P\\x l > V 1 } est l’ensemble des 
paiements possibles et individuellement rationnels . Voici 3 exemples : 


L R 



0 


3 
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9.2. Invariance. 

Soit le jeu 1 symétrique suivant : 


L R 


(3,3) 

(0,0) 

(0,0) 

(2,2) 


a, 6, c, d des réels quelconques. Translatons la matrice précédente comme suit : 


L R 


(3 + fl, 3 + c) 

(0 + 6,0 + c) 

(0 H- fl, 0 -1- d) 

(2 + 6, 2 4- d) 


En particulier la correspondance de meilleure réponse est inchangée : l’invariance stra- 
tégique implique que ces jeux doivent avoir le même ensemble de solutions. 

Si a = —2, b = 0, c = — 1 et d = 0, nous obtenons le jeu 2 : 


T 
B 

et si a = —1, b = 2, c = 1 et d = 0, le jeu 3 : 


T 

B 


L R 


(2,4) 

(2,1) 

(-1,0) 

(4,2) 


L R 


( 1 , 1 ) 

( 0 ,- 2 ) 

(- 2 , 0 ) 

( 2 , 2 ) 


Le jeu 1 admet deux équilibres de Nash purs (T, L) et ( B , R) et un équilibre mixte et 
symétrique ((|T, | B), (|L, | i?.)). Les jeux 2 et 3 admettent évidemment les mêmes 
équilibres de Nash. 

Si une théorie dicte que la solution du jeu 1 devrait être (T, L) car c’est dans 
l’intérêt commun des deux joueurs (ce qui semble raisonnable) et si cette théorie est 
invariante stratégiquement elle devrait sélectionner (T, L) dans le jeu 2, mais l’intérêt 
commun des joueurs dans ce jeu est (Æ, R). Si cette théorie sélectionne dans le jeu 1 
l’équilibre mixte car c’est le seul qui respecte la symétrie du jeu, elle devrait faire de 
même dans le jeu 3. Mais, ce dernier n’est pas symétrique. 
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9.3. Prudence. 

A la différence des jeux à somme nulle, la notion d’équilibre de Nash dans les jeux à 
somme non-nulle ne capture pas la notion de risque. Considérons le jeu suivant : 


T 
B 

(B, B) avec le paiement (3,3) est l’unique équilibre de Nash. Cependant, même si la 
croyance du joueur 1 est que le joueur 2 jouer i?,, va-t-il effectivement choisir B et 
risquer de perdre 100 si pour une raison ou une autre (irrationalité, vengeance, erreur) 
le joueur 2 joue L ? Jouer B semble dangereux pour le joueur ligne alors que jouer T 
est sans risque car au pire il obtient 2. 

Plus généralement a 1 est une stratégie prudente pour le joueur i si pour tout s~ % : 
g l (a l ,s~' L ) > max min g l {T % ^t~ l ) 

Soit l’exemple suivant (Aumann et Maschler, 1972) : 


T 

B 


Le seul équilibre est donné par x = (^,^)ety = (^,|) avec un vecteur de paiement 
d’équilibre (|, \). 

Une stratégie prudente x* du joueur 1 consiste à jouer optimal dans le jeu à somme 
nulle : 


T 
B 

donc x* = (^, |) et garantit | au joueur 1. 

De même, une stratégie prudente y* du joueur 1 consiste à jouer optimal dans le jeu 
à somme nulle : 

T 
B 

donc y* = (^, ^) et garantit | au joueur 2. 

Considérons le joueur 1 : jouer x * lui assure de gagner | . Jouer x ne garantit pas | 


L R 


0 

i 

~Y 

ir 


L R 


2 

0 

~ô~ 

~ 


L R 


( 2 , 0 ) 

( 0 , 1 ) 

( 0 , 1 ) 

( 1 , 0 ) 


L R 


( 3 , 1 ) 

( 2 , 2 ) 

(- 100 , 2 ) 

(3,3) 
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mais c’est la stratégie d’équilibre de paiement |. 

Si le joueur 2 joue sa stratégie d’équilibre y, le joueur 1 sera indifférent entre T et B 
et donc n’importe quelle stratégie sera une meilleure réponse à y, en particulier x*. Et 
s’il ne joue pas la stratégie d’équilibre, l’itération des meilleures réponses ne converge 
pas. 

Rajouter comme stratégies pures ces stratégies donne le jeu suivant : 



L 

R. 

y* 

y 

T 

(2,0) 

(0,1) 

(1,1/2) 

(2/3, 2/3) 

B 

(0,1) 

(1,0) 

(1/2, 1/2) 

(2/3, 1/3) 

X* 

(2/3, 2/3) 

(2/3, 1/3) 

(2/3, 1/2) 

(2/3, 4/9) 

X 

(1,1/2) 

(1/2, 1/2) 

(3/4, 1/2) 

(2/3, 1/2) 


9.4. Pareto optimalité et domination. 

Dans le leu suivant : 


( 1 , 0 ) 

( 0 , 1 ) 

( 0 , 0 ) 

( 0 , 1 ) 

( 1 , 0 ) 

( 1 , 0 ) 

( 0 , 0 ) 

( 0 , 1 ) 

( 1 , 1 ) 


le seul paiement parétien est un équilibre de Nash composé de stratégies faiblement 
dominées. 

9.5. Domination. 

L’addition d’une stratégie dominante pour un joueur peut être défavorable à ce 
joueur : 


T 
B 

T est strictement dominante et induit le paiement (1,1). Si le joueur 1 n’a que la 
stratégie B , l’issue est (5,5). 

9.6. Rationalité et information. 

Dans le jeu suivant, le joueur 2 a des paiements indépendants de ses coups. L’ensemble 
des équilibres de Nash est donc donné par le graphe de la correspondance de meilleure 
réponse du joueur 1 et il y a une seule composante connexe : 


L R 


(10,0) 

(1,1) 

(5,5) 

(0,0) 
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L R 
T 
B 


( 1 . 1 ) 

( 0 , 1 ) 

( 0 , 0 ) 

( 2 , 0 ) 


T 


B I | | 

L | R 


Cependant si le joueur 2 connait les paiements du joueur 1 (et qu’il sait que le joueur 
1 le sait), on peut penser qu’il jouera L (et R, dans le jeu ci dessous). 


T 
B 

Le comportement “rationnel” d’un joueur dépend des paiements des autres joueurs ... 

9.7. Self-enforcing. 

Dans le jeu ci-dessous l’équilibre (T, L) est Pareto-dominant mais (B y R) est risk- 
dominant. 

Par ailleurs (T, L) n’est pas self-enforcing (Aumann, 1990) : le joueur 1 a intérêt à 
ce que le joueur 2 joue L, quels que soient ses plans personnels. 


T 
B 

Par contre dans la bataille des sexes ci-dessous l’équilibre (T, L) est self-enforcing 
pour le joueur 1. Il ne suggère (T, L ) que s’il a l’intention de jouer T. 


L R 


(7,7) 

(0,6) 

(6,0) 

(5,5) 


L R 


( 0 , 1 ) 

( 1 , 1 ) 

( 2 , 0 ) 

( 0 , 0 ) 
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L R 
T 
B 


( 2 , 1 ) 

( 0 , 0 ) 

( 0 , 0 ) 

( 1 , 2 ) 


lO.Théorèmes de Brouwer et de Ky Fan 

Pour prouver le théorème de Brouwer, nous utiliserons le lemme de Sperner qui 
nécessite des notations nouvelles. 

Soit A un simplexe de dimension fc, donc avec k + 1 sommets notés {æ°, ...,æ fe }(en 
dimension zéro c’est un point, en dimension un c’est un intervalle, deux un triangle, 
trois une pyramide, etc...). 

Une subdivision simpliciale de A est une triangulation du simplexe en sous-simplexes. 
Plus précisément, c’est une collection finie de simplexes {AJ qui satisfait U^A* = A 
et pour tout (i, j), A* fl A j est soit vide, soit un sous-simplexe de A* et de A j ap- 
partenant à la collection. Le pas d’une subdivision est le plus large diamètre d’un 
sous-simplexe. 

Soit V la collection des sommets de tous les sous-simplexes. Chaque point v de V 
se décompose d’une manière unique comme combinaison convexe des points extrêmes 
X j ,j = 0 , k : ( V = Y,i=o ai (v) xi ))- Soit 

I(v) = {i : a z {y) > 0} C {0, ..., k} 

l’ensemble des indices ayant un poids strictement positif dans la décomposition : 
conv{x z : i G I(v)} est donc la face minimale de A contenant v dans son intérieur 
relatif. 

Une coloration de V est une fonction qui associe à chaque v dans V un entier 
dans I(v). L’interprétation est la suivante : en tout, il y a k + 1 couleurs possibles. 
Chaque sommet x J a la couleur j. La couleur d’un point v de l’intérieur relatif d’une 
face F de A peut être celle de n’importe quel sommet de F. 

Un sous-simplexe est complètement coloré si ses sommets portent les (k + 1) 
couleurs possibles. 

Lemme 10.1 (Sperner, 1928). 

Pour toute subdivision simpliciale du simplexe , il existe un nombre impair de sous- 
simplexes complètement colorés. 

Preuve : On procède par récurrence sur k. Si k = 0, c’est trivial. Supposons le résultat 
vrai pour k — 1. 

Imaginons que le simplexe soit une maison. Les sous-simplexes de dimension k seront 
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les différentes pièces. Une porte est par définition un sous-simplexe de dimension k — 1 
ayant toutes les couleurs de 0 à à k — 1. 

Une pièce peut posséder aucune porte, une porte ou deux portes. En effet, supposons 
qu’une pièce possède k sommets colorés par les couleurs 0, ..., à k — 1. Si le dernier 
sommet possède la couleur manquante k ) la pièce ne possède qu’une porte (et par la 
même occasion elle sera complètement colorée) , sinon la pièce aura exactement deux 
portes (et il lui manquera une couleur). 

L’hypothèse de récurrence implique qu’il y a un nombre impair de portes sur la face 
contenant les sommets a; 0 , ...,æ fe_1 . Montrons donc qu’il existe un nombre impair de 
pièces avec exactement une seule porte. La preuve est obtenue par un algorithme. 
Imaginez que vous entrez dans le simplexe A par une porte de l’extérieur. Si la pièce 
où vous entrez possède une autre porte, vous entrez via cette porte vers une autre 
pièce, si cette dernière possède une autre porte, vous continuez votre chemin ainsi de 
suite jusqu’à ce que (1) vous sortez de A et ce par la face par laquelle vous êtes entré 
(par hypothèse sur la coloration) ou (2) vous arrivez vers une pièce sans autre porte 
de sortie. Cette dernière sera alors complètement colorée. 

Puisqu’il y a un nombre impair de portes extérieures (par récurrence), il y a un nombre 
impair de pièces complètement colorées que vous pouvez atteindre en venant de l’ex- 
térieur. 

Il reste à considérer le cas d’une pièce P complètement colorée et ne pouvant pas être 
atteinte de l’extérieur. Cette pièce a exactement une seule porte. Vous pouvez donc 
en sortir et entrer dans une nouvelle pièce, et continuer ainsi de suite jusqu’à à ce que 
(1) vous arriviez dans une autre pièce P' sans aucune porte de sortie (complètement 
colorée) et différente de la pièce initiale ou (2) vous sortez de A. Mais l’éventualité (2) 
implique que P peut être atteinte de l’extérieur (absurde). Les pièces complètement 
colorées non liées à l’extérieur vont donc par paires. 

En définitive, il y a en tout un nombre impair de pièces complètement colorées. ■ 

Il existe en particulier au moins un sous-simplexe complètement coloré. Notons 
que la preuve est constructive et donne par la même occasion un algorithme. 

Une version plus forte de ce lemme établit que le nombre de sous-simplexes com- 
plètement colorés avec une orientation positive (i.e. la même que A) est un de plus 
que le nombre de ceux ayant une orientation opposée. (L’orientation est facile à voir 
en dimension 2. En suivant dans l’ordre les couleurs 0, 1 puis 2 d’un sous-simplexe, 
son orientation sera +1 si on tourne dans le même sens que celui de A et elle sera —1 
sinon). On montre que la somme des orientations (indices) est égale à +1. La preuve 
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est sensiblement la même : deux pièces intérieures liées entre elles ont nécessairement 
des orientations opposées et on utilise la récurrence pour les pièces reliées à l’extérieur. 

Corollaire 10.2. 

Toute fonction continue d’un simplexe dans lui-même admet un point fixe. 

Preuve : Soit A k = {(r°, ...,r fc ) G ÆZ fc+1 ;r* > 0,X)i=o r * = 1} I e simplexe unitaire de 
dimension k , / continue de A k dans lui-même et e > 0. On considère une subdivision 
de A k de pas plus petit que e. Soit À une coloration de V qui satisfait : 

À(u) G I(v) fl {i : Piv) < v 1 }. 

Le choix est possible car l’intersection est non vide sinon, 1 = Yli=of l ( v ) > 
^2iei(v) yt = P ar I e l emme de Sperner, il existe un sous-simplexe complète- 
ment coloré, donc k + 1 points v(i,è) avec f l (v(i,e)) ^ v(i,e) 1 pour tout z, et 
|| v(i,e) — v(j,e)\\ < e,Vi,j = 0, ...,k. En faisant tendre e vers 0, on en déduit l’exis- 
tence d’un point d’accumulation v tel que pour tout z, f l (v) < v % , par continuité. 
Puisque v et f(y) sont dans A fe , f(v) = v. ■ 

Lemme 10.3. 

Soit K une rétraction d’un simplexe A. Si f : K — » K est continue, alors f admet 
un point fixe. 

Preuve : Soit h la rétraction de A sur K. h : A — > K C A et h\x = /d|/c- Alors 
/ o h : A — > A est continue et admet donc un point fixe z. Mais z E K donc 
/ o h(z) = f(z) = z est un point fixe de / dans K. ■ 

Théorème 10.4 (Brouwer, 1912). 

Soit C un convexe compact non-vide d’un espace euclidien de dimension finie et 
f : C — ► C continue, alors f admet un point fixe. 

Preuve : Soit A un simplexe contenant C . Puisque C est convexe et fermé, Il la pro- 
jection de A sur C est une rétraction continue (et même Lipschitz). On applique alors 
le lemme précédent. ■ 

Ce théorème a été étendu à des correspondences en dimension finie par Kakutani 
(1941). Une version plus générale est la suivante. 

Théorème 10.5 (Fan, 1952). 

Soit C un convexe compact non-vide d’un espace vectoriel normé et F une correspon- 
dance de C dans C telle que : 

(i)Vce C, F(c) est un convexe compact non-vide, 
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(ü) le graphe de F est fermé. 

Alors , {c G C : c G F(c)} est fermé et non vide. 


Preuve : La preuve se fait par l’absurde. Si F n’a pas de point fixe, la distance <S(æ) 
de tout x au fermé F(x) est > 0. On dénote par l’ouvert convexe Q, x = {y G 
C\d(y,F(x)) < 8{x)/2). U x = {z G C\F(z) C Œ x } est un ouvert contenant x (car F 
est s.c.s.) donc il contient aussi une boule ouverte B(x, s(x)) avec 0 < s(x) < 8(x)/3. 
On a donc B(x ) s(x)) fl iï x = 0. Les boules ouvertes B(x ) s(x)/ 2) recouvrent <7, soit 
B(xi,s(xi)/ 2) un sous recouvrement fini. Pour r = mm.is{xi)/2 et pour tout z e C 
la boule ouverte B(z i r) est incluse dans une boule B(xi,s(xi)). On extrait du recou- 
vrement de C par les boules B(z ) r) un nouveau recouvrement fini {B(z^r)} puis 

d(x,B(zk,r) c ) 

on considère une partition de l’unité subordonnée : /&(#) = ^ ’ — — r r^r. On 

l^jd\X) B^Zj^r) 0 ) 

a donc une famille finie de fonctions continues fk de C dans [0, 1] avec Ylk /fc — 1 
et fk — 0 en dehors de B(z ki r). Prenons y k G F(zk ) et posons f(x) = Ylkfk( x )Vk- 
f induit une fonction continue de conv {yk} dans lui même donc a un point fixe 
x par le théorème de Brouwer. Si fk(x ) > 0 alors x G B(zk,r) par conséquent 
Zk G B(x,r) C B{xi,s{xi )) C U Xi pour un certain i. Donc yk G F{zk) C ü Xi et 
par convexité f(x) G mais x G B(xi , s(xî)) et n B(xi, s{xi )) = 0 ce qui contre- 
dit f(x) = x. • 


Il est aussi évident que le théorème de Kakutani implique celui de Brouwer. On 
peut montrer (Exercice 5.1) que supposer l’existence d’un équilibre de Nash pour tout 
jeu fini à deux joueurs permet de prouver le théorème de Kakutani. Ainsi, il semble 
que toute la difficulté du théorème de Brouwer se résume à l’existence d’équilibre dans 
ce cadre. On a prouvé que beaucoup de problèmes de point fixe appartiennent à la 
classe de problèmes dit PPAD-complets (Brouwer, équilibre Walrasien, équilibre de 
Nash avec beaucoup de joueurs, etc). La même propriété a été établie récemment pour 
les jeux finis à 2 joueurs (Chen et Deng, 2006). Calculer numériquement un équilibre 
de Nash pour un jeu fini à deux joueurs est donc un problème difficile. 
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Variété des équilibres et dynamique 


1. Variété des équilibres 

On se place encore ici dans le cadre des jeux finis. Chaque S 1 est un ensemble 
fini, de cardinal m l et m = *• Un jeu g est alors identifiable à un point de JR. Nm . 

On considère ici la variété des équilibres obtenue en prenant les paiements comme pa- 
ramètres. Les équations d’équilibre forment une famille finie d’inégalités polynomiales 
en (, g , a ) 

Fk(g,cr) <0, k = 1 

où g e B. Nm est le jeu et a le profil de stratégies. 

Soient Q l’ensemble des jeux (on rappelle que le nombre des joueurs et les ensembles 
de stratégies pures sont fixés) et £ le graphe de la correspondance d’équilibre : 

£ = {(g,cr)\g eÇ, a équilibre de g} 

que l’on étend par continuité à la compactification Q de Q et que l’on note £. 


Théorème 1.1 (Kohlberg et Mertens, 1986). 

La projection n de £ sur Q est homotope à un homéomorphisme. 


Preuve : On décompose un paiement g en g et /i, où pour tout h 1 est un vecteur de 
JR m avec 

g i (s\s- i )=g\s\s- i ) + h i (s i ) 


et 


E 


s S' 


.<§*(**,*-*) = 0 , 


Vs i e S\ 


Pour tout a G S = A(S‘ l ) on introduit le vecteur V g l {a~ l ) dans lR m dont la com- 
posante sur s l est le paiement g’ l {s l ^a~ l ) et Vg(a) dénote le vecteur correspondant 
dans 2R m (V g 1 est le paiement vectoriel du joueur i). On pose alors, pour g = (g; h) 
et t G [0, 1] i 


Rt(g> cr) = ( g ; t(cr + Vg(cr)) + (1 - t)h) 


qui est l’homotopie annoncée. 
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On a clairement IIo = n. 

Vérifions que II t (oo) = oo, G [0, 1]. 

On note ||.|| la norme infinie et un voisinage de oo est donc de la forme ||æ|| > M. 
Soit alors ||(( 7 ,a)|| > 2 R+ 1, d’où ||^|| > 2R, + 1 et par conséquent soit ||^|| > R d’où 
\\Mg,v)\\ > R ou bien ||/i|| >2i?,+ let \\g\\ < R, ce qui implique \\t(cr + Vg(cr)) + (l — 
t)h\\ > R. En effet \\t(cr+Vg(cr)) + (l-t)h-h\\ < ||(<r + Vg(cr))-h\\ < l + \\g\\ < R+ 1. 

Il reste à établir le résultat suivant. 

Lemme 1.2. 

tp = Hi est un homéomorphisme de £ sur Ç. 

Preuve : On pose, partant de g = ( g , z), avec 2 ; = {z 1 } et z l G lR m : 

v* = min{u; J2 seS ^ Z ° ~ U ^ + = ^ 
puis <t* = (zl - u i ) + et enfin i\ = z* - a* - g\s, 

Alors t/j(g) = tp(g;z) = ((g J), a) : 

(i) est une application de Q dans £, et satisfait 

(ii) ipo ip = Idg 

(iii) 'ipoip = Idg. 

Pour le premier point, vérifions que g (qui est un profil de stratégies, par construc- 
tion de v) est un équilibre dans le jeu 7 = (g,f). Si a\ > 0, g\ = z\ — v % et alors 
7 *(s, g~ z ) = g z (s y a~ l ) + P's — z z s — g\ = v l . Par ailleurs, g\ = 0 implique z\ < v l donc 
7 *(s, g~ 1 ) = z\ < v % . Les actions jouées par le joueur i donnent le paiement v l et les 
autres moins : a est un équilibre de paiement vectoriel v. 

Pour (ii), partant de g = (g,z) nous obtenons, via 0, le couple (7 = (g^)]cr) puis, 
par p , le jeu (< g , a + V'f{&)). 

Or 7 (cr) = g(a) + ^(<r) = g(a) + z(a) —a — g(a) donc cr + V'y(a) = z et le jeu d’arrivée 
est g. 

Finalement pour (iii), partant d’un couple {g = (#, h)\a) dans £ on obtient 
(g, a + Vg(a)) dans G • Soit z = g -h Vg(G) comme dans la construction précé- 
dente, point (i). Mais puisque g est un équilibre dans g (de paiement w) on obtient : 
g\ > 0 => g x (s , g~ % ) = w % et g\ = 0 => g z (s i g~ 1 ) < w l . Donc le v associé à 2 ; est w , la 
stratégie associée est g et i — h. ■ 
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Soit g un jeu et NE(g) l’ensemble de ses équilibres qui est composé d’un nombre 
fini de composantes connexes Ck, k = 1, L. Ck est essentielle si pour tout voisinage 
V de Ck dans E, il existe un voisinage W de g dans Q tel que pour tout g' G W il 
existe a G NE(g') fl V. 

Proposition 1.3. 

i) Génériquement V ensemble des équilibres est fini et impair. 

ii) Tout jeu possède dans £ une composante essentielle. 

Preuve : 

i) Génériquement un équilibre est isolé et tr ans verse à la projection de la variété 
des équilibres sur l’espace des jeux. Si il est “sortant” le degré est 1 et -1 si il est “ren- 
trant”. Le degré global de la projection (somme sur les composantes) est invariant par 
homotopie donc égal à 1 (par l’homéomorphisme) : le degré est 1 pour p + 1 équilibres 
et -1 pour p autres. 

ii) Par récurrence, il suffit de montrer que si les équilibres de g sont dans U U V, 
où U et V sont 2 ouverts dont les adhérences sont disjointes alors il existe un voisinage 
W de g tel que tout g' e W a des équilibres dans U ou tout g' e W a des équilibres 
dans V. 

Soit \P( g ) le graphe de la correspondance de meilleure réponse en g (dans E x E). Il 
existe donc un voisinage (à coupes convexes) C de $(<7) tel que l’intersection avec la 
diagonale soit dans (U U V) x {U U V). 

On procède par l’absurde, donc on suppose qu’il existe g\ proche de g dont tous 
les équilibres sont dans U et de même pour g 2 et V. Par ailleurs on peut supposer 
que $(gi) C C. 

Soit a une fonction continue de E dans [0,1], nulle sur U et égale à 1 sur V. 

La correspondance définie par T(cr) = a(cr)^(pi)(a-) + (l — cx(a))^(g 2 )(cr) est s.c.s. 
et à valeurs convexes. Son graphe est inclus dans C donc son ensemble de points fixes, 
non vide est dans U U V. Considérons un tel a = T(cr). 

Si a G C/, a(cr) = 0 et a est un point fixe de #(<72) donc dans V. On obtient de 
même une contradiction si a G V. ■ 



58 


Chapitre 5. Variété des équilibres et dynamique 


Soit le jeu suivant, paramétré par a 


T 

M 

B 


La correspondance d’équilibre est donnée par : 


L B. 


(a,0 

(«,0) 

(1,-1) 

(-1,1) 

(-1,1) 

(1,-1) 



-• 1 

0 a 

FIG 5.1 


E 


2. Champs de vecteurs et dynamique 

I Définition 2.1. Un champ de Nash est une application continue (ou une correspon- 
dence s.c.s) $ de G x E dans E telle que 

NE(g) = {<J € E; $(g, cr) = a} 

Si on ne demande pas de régularité en g on pourrait, pour chaque jeu, sélectionner 
un équilibre a et définir un champ de vecteurs ad-hoc. 


Proposition 2.2. 

Les deux fonctions suivantes sont des champs de Nash : 
1. (Nash, 1950) 


*(»,*) V) 


gV) + (gV,g-*)-V(g)) + 

1 + T, t i{g i {t\a~ i ) - g i {a))+ 
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2. (Gui, Pearce and Stacchetti, 1993) 

Soit Py, l’opérateur de projection sur le convexe E, produit des simplexes E\ On définit 

<Hg,a) = Px({a i + Vg\a- i )}). 


Preuve : Pour le point 1, voir Chapitre 4, preuve du Théorème 5.2. 

Pour le point 2, observons que a est un équilibre de g si et seulement si : 

(a, Vg(a )) > (r, Vg(a)), Vr 6 S. 

Par ailleurs la projection d’un point x sur un convexe C est l’unique point II c(x) G C 
vérifiant : 

{x - n c (x),y - n c (x)) < o, y y e c. 

La première inégalité, écrite sous la forme 

(a + Vg(a) - g, r — g) < 0, Vr G E 

exprime donc le fait que a est la projection de a + Vg(cr) sur E, d’où le point fixe de 

«K^O- 

Chaque champ de Nash $ induit pour chaque jeu g une dynamique 

à = $(g,c r) - g 

sur le produit des simplexes E, dont les point stationnaires sont NE(g). 

Chaque composante de l’ensemble des points fixes a un indice et la somme des indices 
est égale à 1 qui est la caractéristique d’Euler du simplexe (Théorème de Poincaré- 
Hopf, voir Milnor (1965)). 

De plus l’indice d’une composante C est indépendante du champ de Nash et est égal au 
degré sur C de la projection n de £ sur Q (Demichelis and Germano (2000), Govidan 
and Wilson (1997)). Pour le jeu suivant, paramétré par t : 


L R 


(M) 

(0,0) 

(0,0) 

(1 


on obtient pour la variété et les dynamiques la situation suivante : 
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0 1 E 


FIG 5.2 


3. Equilibre et évolution 

3.1. Dynamique du réplicateur . 

On considère un jeu symétrique à 2 joueurs spécifié par une matrice A (Ixl). A. ^ 
est la “fitness” (le taux de reproduction) de i dans une interaction (i,j). (Le paiement 
du joueur 2 est donc B = l A.) 

La première approche correspond à l’étude d’une population unique et poly- 
morphe de composition p jouant en stratégies pures, une proportion p 1 étant de “type 


Définition 3.1. Une population p G A (/) est stationnaire si 

p 1 > 0 => iAp = pAp 

donc tous les types présents ont le même “taux de reproduction” et la composition de 
la population reste identique après l interaction. 

Si p a un support plein, c’est un équilibre symétrique, mais par ailleurs toute 
stratégie pure est stationnaire. 

Définition 3.2. La dynamique du réplicateur (RD) est défiinie par : 

Pt = F(Pt ) 

où F est U application définie sur A(7) par 

F l {p) = p % {iAp — pAp). 
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Cette dynamique préserve le simplexe car ^2 i F*(p) = pAp — ^^pAp — 0. 

On peut aussi définir une population stationnaire comme un point stationnaire de la 
dynamique du réplicateur. 


3.2. RSP. 

Considérons le jeu suivant (“rock, scissors, paper”) : 


C B A 
C 
B 
A 


où a et b sont deux paramétres > 0. 


(0,0) 

(a, -b) 

(-b, a) 

(-6, a) 

(0,0) 

(a, -b) 

(a, -b) 

(- b , a) 

(0,0) 


Proposition 3.3. 

L’unique équilibre de Nash est E = (1/3, 1/3, 1/3). C’est un attracteur de la dyna- 
mique du réplicateur pour a> b et un U répulseur” si a < b. 


Preuve : Il n’y a pas d’équilibre en stratégie pure et face à une stratégie ayant un 
support sur 2 pures, la seule meilleure réponse est pure donc E est l’unique équilibre. 
Calculons la fitness moyenne pour p dans le simplexe A (/) : 

pAp = (a - b)(p l p 2 + p 2 p 3 + p l p 3 ) 

= ^Ÿ^(i-lbll 2 )- 

Soit V(p) = rii=iP Z ) Qui est maximal en E. Puisque p\ = pK^P 2 — bp 3 — PtAp t ), on 
obtient 

J t log V(pt) = Y? i= i p{ = ( a ~ b ^~ 3ptApt = 2 - ( 3 IMI 2 “ !) 

Donc pour a > 6, V croît tant que ||pt|| 2 > 1/3, ce qui implique la convergence vers 
E. 

D’autre part E est un répulseur pour a < b. ■ 
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A A 




FIG 5.3. : cas a > b; a < b 


3.3. Jeux de potentiel . 

Le cas de jeu de partenaires (A = l A = B) est un cas particulier de jeu de potentiel 
(Monderer et Shapley, 1996) : il existe une fonction $ de S dans EJ 1 telle que pour 
tout i et tous s 1 , t l e 5\ u~ x G S~ x : 

GV.O - G^t^u-*) = $(^,0 - 

En particulier la dynamique du réplicateur peut être exprimée directement à Laide 
$. Explicitement, pour le joueur i et chacune de ses stratégies s : 

Proposition 3.4. 

Pour un jeu de potentiel !, $ est une fonction de Lyapounov pour la dynamique du 
réplicateur et les populations stationnaires. 

Preuve : Soit f t = ®(pt)- Donc f t = par linéarité, mais on a : 

m,Pïi = ZsP\ s *(s, P n = z sP r{$(s, P n - #(p*)]*(a, P r < ). 

On ajoute 

0 = E s pj s [$(s,p t -i ) - $(pt)]$(pt) 

pour obtenir : 

m,Pti = XsPTMwn - $( Pt )i 2 

et le minorant est 0 pris sur les points stationnaires de (RD). ■ 

Un exemple important correspond aux jeux de congestion , see e.g. Chapter 18 in 
Nisan & alii (2007) . 
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3.4. ESS. 

La notion de stratégie évolutionairement stable (“Evolutionary Stable Strategy”, ESS) 
dûe à Maynard Smith (1982) correspond à l’étude d’une population homogène as- 
sexuée qui posssède un “type mixte” p et l’on étudie sa stabilité locale. 

Définition 3.5. p G A (/) est une ESS si elle est robuste face aux perturbations au 
sens où, pour tout q G A (I),q ^ p , il existe e(q) > 0 tel que 0 < e < e(q) implique 

pA((l - é)p + eq) > qA{{ 1 - e)p + eq). 

e(q) est la barrière associée à q. 

Cette inégalité se décompose en : 

pAp > qAp 

donc p est un équilibre symétrique, et si il y a égalité 

pAq > qAq. 

Un exemple classique d’ESS est un équilibre strict. 

Proposition 3.6. 

p est un ESS ssi une des conditions suivantes est satisfaite : 

1) Il existe £q (indépendant de q) tel que 

pA(( 1 - e)p + eq) > qA(( 1 - e)p + eq) 

pour tout e G (0, eo) et tout q G A(I),q ^ p, 

2) il existe un voisinage V (p) tel que 

pAq > qAq, Wq e V(p), q^p. 

Preuve : Considérons la partie du bord dX du simplexe X = A (/) qui fait face à p, 
dX p = {q\ q G dX avec q 1 = 0 et p 1 > 0 pour un indice (au moins) %}. Cela forme un 
ensemble compact disjoint de p sur lequel la barrière € (q) est bornée inférieurement 
par £o > 0. 

Maintenant tout r ^ p dans X peut être écrit comme r = tq + (1 — t)p avec t > 0 et 
q G dX p d’où (1 — e)p + er = (1 — e')p + e'q avec e' < e et donc dès que e <Eq: 

pA(( 1 - e')p + e'q ) > qA(( 1 - e')p + e'q). 

On a aussi en multipliant par e' et en additionnant (1 - E')pA(( 1 — e')p + e'q) 

pA(( 1 - e')p + e'q) > ((1 - e')p + e’q)A{{\ - e')p + e'q) 
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qui implique : 

pA((l - e)p + er) > rA(( 1 - e)p + er). 

Ceci termine le point 1. 

On vient de voir que sur dX v , pour £ < £o : 

pA((l - e)p + eq ) > qA((l - e)p + eq) 

donc on obtient pour £ G (0, £q) : 

pA((l - é)p + £q) > ((1 - é)p + £q)A(( 1 - £)p + £q). 

Il reste à remarquer que quand q varie dans dX p et £ G (0, £o) l’ensemble ((1 — £)p-\-£q) 
décrit un voisinage pointé V(p) \ {p}. 

Réciproquement, partant de q ^ p, p' = (1 — é)p + £q sera dans V (p) \ {p} pour £ > 0 
assez petit, et alors pAp' > p'Ap' = [(1 — e)p + £q\ Ap' d’où l’on déduit : 

pAp' > qAp'. 


Dans le jeu RSP le seul équilibre est ESS ssi a > b et il n’y a pas d’ESS pour a < b: 
en effet chaque stratégie pure fait ausi bien que (1/3, 1/3, 1/3) face à (1/3, 1/3, 1/3) 
et donne 0 face à elle-même alors que (1/3, 1/3, 1/3) induit (a — b )/ 3 < 0. 


Proposition 3.7. 

p est un ESS ssi V(x) = n^x 1 )^ est localement une fonction de Lyapounov pour la 
dynamique du réplicateur. 

Preuve : V a un maximum unique dans A(7) pris en p : en effet l’inégalité de Jensen 
appliquée au log donne 

T/ log^/p*) < log 53.x* = 0. 

Soit v t = logV(x t ). Alors, dans un voisinage de p, on a 

- x t Ax t] 

= pAx t - x t Ax t > 0. 

■ 

Pour une étude des jeux d’évolution voir Hammerstein et Selten (1994), Hofbauer 
et Sigmund (1998), van Damme (1994), Weibull (1995). 



CHAPITRE 6 


Jeux sous forme extensive 


Un jeu sous forme extensive décrit de manière précise les règles du déroulement 
du jeu : qui joue, quand, quels sont ses choix et quelle est son information sur le passé 
de la partie. 


Son analyse a des applications très variées : théorie descriptive des ensembles, logique, 
informatique, économie ... 

La façon la plus simple de visualiser ce modèle est de penser à un jeu de société 
comme les échecs. Il s’agit d’un jeu où les joueurs jouent séquentiellement suivant un 
ordre bien défini. Au moment où un joueur doit jouer il sait tout ce qui s’est passé. A 
la fin du jeu les joueurs reçoivent un paiement qui dépend de toute la suite des coups. 

1.1. Description. 

Un jeu sous forme extensive à information parfaite G est décrit à l’aide d’un arbre 
orienté fini sans cycle. Il est défini par : 

(1) Un ensemble de noeuds T 


1. Jeux à information parfaite 

Un jeu à information parfaite correspond au cadre le plus naturel et le plus simple. 



(3) Une application prédécesseur 4> de T \ {6} dans T 


(4) Des noeuds terminaux R. = T\ Im{(jj) ou résultats 

(5) Des positions P = T\ R = Jra(0) 



où N est l’ensemble des joueurs. 

On note S(p) = les successeurs de p : c’est l’ensemble des noeuds dont p est 

le prédécesseur. 


Déroulement du jeu : 

(1) Soit i G N le joueur tel que 9 G P 


65 


66 


Chapitre 6. Jeux sous forme extensive 


(2) Le joueur i commence le jeu. Il choisit un successeur p\ de 6. 

(3) Inductivement, soit j G N tel que p t G Pj. Le joueur j joue au noeud p t 
(étape t + 1). Il choisit un successeur de p t) p t +\ G S(p t ). 

(4) Le résultat est l’élément de B, atteint par cette procédure, il correspond à 
une partie. 

(5) Chaque résultat induit un paiement pour chaque joueur. 

Tout noeud p définit une histoire précédant p (la suite des prédécesseurs itérés) et 
un sous-jeu suivant p, noté G[p], qui est la famille de ses successeurs successifs. Notons 
que G\p] est aussi un jeu sous forme extensive à information parfaite, d’origine p. 



FIG. 6.1 : Jeu sous forme extensive à information parfaite. 


Le joueur 1 commence. Il a deux actions : gauche et droite. S’il choisit l’action droite, 
le noeud p est atteint où le joueur 2 a le choix entre les actions a, 6, c. S’il choisit 
l’action a on atteint le noeud terminal x G P, etc ... 

1.2. Stratégie et forme normale. 

Une stratégie cr l du joueur i est définie sur Pi et associe à toute position p G Pi un 
successeur. Un profil de stratégies a = (cr 1 , ...,cr N ) induit inductivement une partie, 
donc un résultat r dans R. 

Ainsi dans le jeu 2 ci-dessous, le joueur 1 a deux stratégies S 1 = {a:,/?} et le 
joueur 2ena3x2 = 6:5 2 = {aA, aP, 6A, 6P, cA, cB}. La stratégie b A du joueur 2 
signifie qu’il choisit l’action b au noeud p et Faction A au noeud q. 
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FIG. 6.2 : Jeu 2 sous forme extensive à information parfaite. 


I Définition 1.1. L'application F qui associe à chaque profil de stratégies a un résultat 
dans R est appelée la réduction sous forme normale ou stratégique. 

La forme normale du jeu 2 est 



aA 

aB 

bA 

bB 

cA 

cB 

a 

X 

X 

y 

y 

Z 

Z 

a 

u 

V 

U 

V 

U 

V 


Pour achever la définition du jeu, il faut associer à chaque élément dans R un paiement 
pour chaque joueur. 

1.3. Jeux déterminés. 

Un jeu à deux joueurs et à information parfaite est simple s’il existe une partition 
(i? 4 , R.f) de R tel que si le résultat est dans Ri le joueur i gagne et l’autre joueur perd. 
Le joueur i a une stratégie gagnante s’il peut forcer un résultat dans Ri : 

3 <t\ V a"* F [a} e R\ 

Définition 1.2. Un jeu est déterminé si un des joueurs a une stratégie gagnante. 

• Théorème 1.3 (Zermelo, 1912). 

Tout jeu fini à deux joueurs et à information parfaite simple est déterminé. 

Preuve : La démonstration procède par induction sur la longueur n de l’arbre. Adop- 
tons la convention qu’un jeu déterminé a la valeur +1 si le joueur 1 a une stratégie 
gagnante et —1 si le joueur 2 a une stratégie gagnante. 

Un jeu en une étape (donc avec un seul joueur) est clairement déterminé : si le 
joueur en question possède une action qui lui permet de gagner il la joue, sinon c’est 
l’autre qui gagne sans rien faire. 
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Preuve 1 : Induction “aval” (forward) 

Les successeurs de l’origine définissent des sous-jeux de longueur < n — 1 donc ils sont 
déterminés. Si le joueur 1 commence, il lui suffit de choisir le sous jeu qui a la plus 
grande valeur. Si celle-ci est +1, il gagne, sinon il perd quoi qu’il fasse. Si c’est le 
joueur 2 qui commence, il lui suffit de choisir le sous jeu avec la plus petite valeur. Si 
celle-ci est -1, il gagne sinon il perd quoi qu’il fasse. 

Preuve 2 : Induction “amont” (backward) 

Les noeuds prédécesseurs des noeuds terminaux correspondent à des jeux en une étape 
et sont donc déterminés. On remplace chacun par un noeud terminal ayant cette va- 
leur. Le nouveau jeu est de longueur strictement inférieure et par récurrence il est 
déterminé. Par ailleurs si un des joueurs est gagnant dans le nouveau jeu, il l’est aussi 
dans le jeu initial (par concaténation de stratégies gagnantes) . ■ 

Supposons que l’ensemble des résultats B, = {r\ y-i r^... >-i r n } soit ordonné selon 
les préférences du joueur 1 (on identifie les résultats où le joueur 1 est indifférent). 
Un jeu à deux joueurs est dit strictement compétitif si le joueur 2 a exactement les 
préférences inverses sur B. : r\ -<2 ^ 2 --- -<2 r n - 

Le jeu est déterminé s’il existe k tel que le joueur 1 peut forcer l’ensemble {n, 7*2, , .., r &} 
et le joueur 2 peut forcer {r^, rfc+i, , .., r n }. 

Si les résultats sont interprétés comme étant les paiements du joueur 1 et si le jeu est 
à deux joueurs et à somme nulle, la détermination du jeu est équivalente à dire que 
le jeu a une valeur (qui serait donc r^). 


I Corollaire 1.4. 

Tout jeu fini à information parfaite à deux joueurs et strictement compétitif est dé- 
terminé. 


Preuve : Posons B, m = {ri,...,r m } et B.q = 0. Soit i?,& le plus petit ensemble i?, m , 
m = 1, ...,n que le joueur 1 peut forcer. Puisque le joueur 1 ne peut pas forcer Rk-u 
le joueur 2 peut forcer son complémentaire {r^ r/c+i..., r m }. ■ 

Application : le jeu d’échec est un jeu à information parfaite, fini, qui admet 
seulement trois résultats possibles. Il est donc déterminé, ce qui implique que soit un 
des deux joueurs peut, en jouant de manière optimale, être certain de gagner, soit les 
deux peuvent (en jouant bien) forcer au pire un match nul. Cependant, la complèxité 
de ce jeu est telle qu’on ne sait pas quel joueur a un avantage. 
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1.4. Le joueur hasard. 

Dans plusieurs situations (comme le bridge ou le poker), certaines transitions peuvent 
être la conséquence d’un processus aléatoire exogène qui suit une certaine loi de proba- 
bilité P (par exemple la répartition des cartes entre les joueurs). Il est facile d’étendre 
notre modèle de base en rajoutant un nouveau joueur : le joueur 0 (qui va jouer le rôle 
du joueur hasard ou de la nature). On doit simplement spécifier en plus dans la des- 
cription du jeu les noeuds où le joueur hasard va intervenir et avec quelles probabilités 
les transitions se font vers les successeurs immédiats. 



FIG. 6.3 : Jeu sous forme extensive à information parfaite avec le joueur hasard 


Dans le jeu ci-dessus, si le joueur 1 choisit l’action b pour son premier coup au 
noeud origine 0 alors, le hasard (chance) choisit l’action suivante (c ou d) suivant 
la distribution de probabilité (^, |). Ainsi, avec probabilité ^ le jeu arrive au noeud 
P 2 où c’est encore au tour du joueur 1 de jouer et avec probabilité | le jeu arrive 
au noeud ps où c’est au joueur 2 de jouer. Le couple de stratégies (6A, fi) induit la 
distribution ^ y + sur les résultats. 

Proposition 1.5. 

Tout jeu fini à information parfaite à deux joueurs à somme nulle et hasard admet 
une valeur en stratégies pures. 

Preuve : Faisons la preuve par induction aval. 

Si le hasard commence, pour chaque choix aléatoire possible k (avec probabilité 
Pfc), l’hypothèse de récurrence implique que le sous jeu a une valeur Vk et les joueurs 
des stratégies optimales pures (s fc , t k ) . Le jeu de départ a donc une valeur v = Y^kVkVk 
et une stratégie optimale s = (s fc ) pour le joueur 1 et t = ( t k ) pour le joueur 2. 
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Si le joueur 1 commence, chaque sous jeu possible k a une valeur Vk et des stra- 
tégies optimales pures . La valeur du jeu est max^fc. Pour assurer v, il suffit 

au joueur 1 de commencer par jouer l avec vi = max^Vk puis de jouer suivant s l . De 
même, t = ( t k ) est une stratégie optimale du joueur 2. 

Si le joueur 2 commence, la valeur est min k Vk et le résultat est dual. ■ 

1.5. La forme normale réduite. 

Dans le jeu suivant le joueur 1 contrôle deux noeuds et possède à chacun deux ac- 
tions : il a donc 4 stratégies : S 1 = { Aa , A/3, Ba , B/3} et le joueur 2 joue seulement à 
un noeud et a deux stratégies : S 2 = {a, 6}. 



FIG. 6.4. : Forme normale réduite 


La forme normale est représentée sur l’espace des résultats par : 

a b 
Aa 
AP 
Ba 
BP 

On remarque que les stratégies Aa et A/3 du joueur sont équivalentes en un sens très 
robuste : quelque soit la stratégie du joueur 2, la distribution sur les parties (et donc 
les résultat associés) est la même pour les deux stratégies. En effet, ces stratégies 
ne diffèrent que sur des positions qui ne peuvent pas être atteintes étant donnée la 
spécification par ailleurs ces stratégies. La forme normale réduie du jeu 4 est donc 

a b 


X 

X 

X 

X 

y 

Z 

y 

w 


A 

Ba 

BP 


X 

X 

y 

Z 

y 

w 
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En général, deux stratégies s 1 et £* du joueur i sont équivalentes si pour tout s -1 G S -i , 
g l (s *, s~ l ) = g l (t % , s”*). Dans la réduction du jeu, les stratégies équivalentes sont iden- 
tifiées. 


1.6. Equilibre et équilibre S-parfait. 

Les résultats et preuves précédents s’étendent facilement aux jeux à N joueurs. 

La construction via l’induction amont donne lieu à énoncé plus précis suivant. 

I Définition 1.6. Un profil de stratégies a est un équilibre S -parfait si pour toute po- 
sition p } la stratégie <j\p\ induite par a dans le sous jeu G\p] définit un équilibre de 
Nash dans ce sous-jeu. 

I Théorème 1.7. 

Tout jeu fini à information parfaite avec ( ou sans ) joueur hasard admet un équilibre 
S-parfait en stratégies pures. 

Preuve : On applique la méthode d’induction amont. ■ 

Application : résolvons le jeu ci-dessous par induction amont : 



FIG. 6.5. : Induction amont. 


Au noeud qu’il contrôle, le joueur 2 choisit A si ys > V 2 • Le joueur 1 choisit alors b si 
Xs > x\ et (6, A) est alors l’unique équilibre S-parfait. Par ailleurs dès que x\ > £ 2 , 
le couple (a, B) est un équilibre. 

La forme normale est : 


a 

b 


A B 


* 1 , • 

xi, . 

^3, 2/3 

X2,V2 
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Proposition 1.8. 

Génériquement y un jeu fini à information parfaite (avec ou sans le joueur hasard) 
admet un unique résultat induit par un équilibre S -parfait pur. 

Preuve : Si le jeu ne contient pas de joueur hasard et tous les paiements sont deux à 
deux différents, un joueur n’est jamais indifférent lors de l’induction amont. Donc il 
y a un seule histoire S-parfaite. 

Si le jeu contient le joueur hasard, en perturbant s’il le faut les probabilités du joueur 
hasard ou les paiements des joueurs, aucun joueur ne sera indiférent. L’ensemble des 
jeux avec plus d’un résultat induit par un équilibre sous-jeu parfait a une probabilité 
nulle si les paiements sont choisis au hasard (par exemple uniformément dans [0, 1]). 

■ 

Remarque 

La proposition précédente ne s’applique pas aux équilibres de Nash : 

- Ils ne sont pas géneriquement en nombre fini. 

- Les issues correspondantes sont génériquement en nombre fini (Kreps et Wilson, 
1982) mais pas necéssairement impair. 

Dans le jeu suivant il y a deux composantes d’équilibre et deux issues stables par 
perturbation de paiements sous la forme extensive. 




FIG. 6.6. : Equilibre générique sous forme extensive. 


1.7. Jeux infinis. 

L’hypothèse de finitude dans le théorème de Zermelo est essentielle et porte à la fois 
sur les ensembles de choix et la durée du jeu. 

Le jeu suivant à un joueur n’a pas d’équilibre : 
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FIG. 6.7. 


Gale et Stewart (1953) ont introduit le jeu suivant. Deux joueurs choisissent alter- 
nativement un élément dans {0, 1}. Cela engendre une suite infinie (x\, x 2 , ...) qui peut 
être vue comme le développement binaire d’un nombre x dans [0, 1] : x = ^Æî/ 2*. 
Etant donné un sous-ensemble A C [0, 1], le joueur 1 gagne dans le jeu G a si et 
seulement si le résultat est dans A. 

Théorème 1.9. (Gale et Stewart, 1953) 

Si A est ouvert ou fermé, le jeu G a est déterminé. 

Il existe des ensembles A pour lesquels le jeu G a n } est pas déterminé. 

Preuve : Supposons que A soit ouvert (une base d’ouverts est donné par les suites 
de début fixé) et que le joueur 1 n’ait pas de stratégie gagnante. Donc pour tout 
choix X\ du joueur 1 , il existe un choix x 2 du joueur 2, tel que le joueur 1 n’ait pas 
de stratégie gagnante dans le sous jeu suivant X\X 2 - Inductivement ceci définit pour 
chaque £2n+i> un élément £ 271+2 tel que le joueur 1 n’a pas de stratégie gagnante dans 
le sous jeu suivant x \, ..., £ 2 n+ 2 - Cette procédure produit (partiellement) une stratégie 
r du joueur 2 qui est gagnante. Sinon, soit cr gagnant face à r donc (cr, r) génère une 
partie h G A. A étant ouvert on a déjà que le sous jeu prolongeant h,2 n est dans A , 
pour un certain n. Ceci contredit la construction de r. 

Si A est fermé et que le joueur 2 n’a pas de stratégie gagnante, il existe un coup initial 
x\ du joueur 1 tel que le joueur 2 n’a pas de stratégie gagnante dans le sous jeu issu 
de x\. Mais par dualité, ce jeu est ouvert pour lui et la preuve précédente implique 
que le joueur 1 y a donc une stratégie gagnante, d’où le résultat par concaténation. ■ 

Ce résultat d’existence a été amélioré par plusieurs auteurs et notamment Martin 
(1975) qui a montré que pour tout borélien A , le jeu est déterminé. 

Le jeu de Gale et Stewart a des applications fondamentales en théorie descriptive des 
ensembles, logique et informatique théorique. 

On remarque que si on écrit x G A comme une proposition P(x\, X 2 > ...)> l’existence 
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d’une stratégie gagnante pour le joueur 1 devient : 

(Q i) 3 xi, Væ2, 3x 3, VÆ4, • • • tel que P(xi,X2, ...) est vraie 
et que la détermination du jeu dit que NON(Q\) implique 

(Q 2 ) Vxi, 3x2, VX3, 3x4, • * * tel que P(x 1, X2, ...) est fausse. 

2. Jeux à information imparfaite 

Dans plusieurs situations réelles, un des joueurs ne connait pas, au moment où il 
doit jouer, toute l’histoire passée du jeu. Par exemple, dans le jeu de poker, un joueur 
n’est pas informé des mains de ses adversaires. Par ailleurs la description de la section 
précédente ne permet pas de représenter les jeux “simultanés”. 

2.1. Ensembles d’information . 

L’information du joueur i est représentée par une partition de Pi en ensembles 
d’information P-*. Les noeuds d’un même ensemble d’information sont indistinguables 
pour le joueur qui y joue. Ils doivent donc avoir le même nombre de successeurs et des 
actions correspondantes qui définissent une classe d’équivalence sur les successeurs 
des positions dans un ensemble d’information. 

Voici deux représentations de Matching Pennies : 



FIG. 6.8. : Deux représentations de Matching Pennies 
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La représentation par un arbre est parfois trompeuse. On ne peut plus désormais 
associer à l’aide d’une horloge publique, un temps à chaque ensemble d’information. 
Dans le jeu suivant le joueur 1 téléphone au joueur 2 puis au joueur 3 en cas de 
réponse négative, ou inversement, mais n’indique pas ce choix à son interlocuteur. 


1 



La position x ' est dans le temps après la position x et de même y' après y, mais 
l’appartenance au même ensemble d’information impose que y et x' sont atteints à la 
même date. 


2.2. Réduction sous forme normale. 

Une stratégie pure pour le joueur i est une application qui associe à chaque ensemble 
d’information P-* du joueur i une classe d’équivalence de successeurs q G S(P^). Un 
profil de stratégies induit une partie, donc un résultat, et on a comme dans le cas 
d’information parfaite une réduction sous forme normale. 

Cependant, deux formes extensives ayant la même forme normale peuvent avoir 
des histoires fondamentalement différentes comme le montrent les trois jeux suivants. 
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La représentation sous forme normale est 



et 

êr' 
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rr' 
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Par ailleurs nous allons voir dans la section suivante que cette “réduction” est parfois 
inadéquate. 

2.3. Stratégies. 

L’existence d’ensembles d’information ne permet pas à un joueur d’associer à une 
position p l’histoire qui y conduit ou le sous jeu qui en est issu. En particulier les dé- 
monstrations obtenues via induction amont ou aval ne s’appliquent plus. Par ailleurs 
il est clair qu’il n’y a plus existence de stratégies pures optimales, voir FIG 6.8.. On 
est donc amené à considérer des classes plus larges. 

Pour chaque joueur î, soit S l l’ensemble de ses stratégies pures. 

L’ensemble des stratégies mixtes pour le joueur i est = A (S 1 ) : une stratégie mixte 

est un choix aléatoire d’une stratégie pure. 

On pourrait imaginer une autre façon de probabiliser entre les actions qui soit plus 
en accord avec l’aspect séquentiel. Le joueur i choisit au hasard, à chaque fois qu’il se 
trouve à un ensemble d’information P*, parmi les actions disponibles à ce moment. 
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Une stratégie de comportement est donc une application qui associe à chaque ensemble 
d’information Pf une probabilité sur les actions qui y sont possibles (la classe d’équi- 
valence des successeurs). Soit C 1 cet ensemble. 

Enfin une stratégie générale est un choix aléatoire de stratégie de comportement et 
on pose Q % = A (C l ). 

Dans le jeu suivant à un joueur, il y a deux stratégies pures a et b qui induisent les 
résultats x et z. Utiliser des stratégies mixtes permet d’obtenir toutes les distributions 
sur (x, z). Une stratégie de comportement est définie par la probabilité t de choisir 
a dans l’ensemble d’information. Elle induit la distribution (£,£(1 — £),( 1 — t) 2 ) sur 
les noeuds terminaux (x, y , z) ; en particulier (1/2, 1/4, 1/4) qu’une stratégie mixte ne 
peut pas atteindre. 

X 

y 

z 

FIG. 6.11. : Comportementale non mixte 

Dans l’exemple suivant le joueur contrôle deux ensembles d’information et a 4 
stratégies pures : Ll,Lr,B.l,B.r. L’utilisation de stratégies mixtes permet d’obtenir 
toutes les distributions sur les issues (x, t/, 2 , w). Une stratégie de comportement est 
définie par les 2 probabilités s = P(L) et t = P(l ). Elle induit une distribution sur 
les issues qui satisfait P(x)P(w) = P(y)P(z). 


I 

x y z w 

FIG. 6.12. : Mixte non comportementale 
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Donc en général aucun des ensembles de stratégies mixtes ou de comportement ne 
contient l’autre. 

En particulier, dans le jeu suivant (Isbell, 1957) 



les stratégies pures garantissent au plus 0 au joueur 1, 
les stratégies de comportement garantissent au plus 25/64, 
les stratégies mixtes garantissent au plus 1/2, 

la stratégie générale (1/2, 1/2) sur (3/4, 0, 1/4; 0, 1) et (0, 3/4, 1/4; 1, 0) garantit 9/16. 

2.4. Mémoire parfaite. 

On introduit ici des conditions sur le jeu qui permettent de comparer stratégies mixtes 
et stratégies de comportement. 

Définition 2.1. Un jeu sous forme extensive est linéaire pour le joueur i s’il n’existe 
aucune partie qui traverse plus d’une fois un ensemble d’information du joueur i. 

Noter que les jeux 6.11 et 6.13 ne sont pas linéaires. 

Théorème 2.2 (Isbell, 1957). 

Si le jeu est linéaire pour le joueur i, pour toute stratégie de comportement p % il existe 
une stratégie mixte a % telle que pour tout profil 6~ l des autres joueurs, les distributions 
induites P et P coincident sur les noeuds terminaux R. 

Preuve : Pour toute stratégie pure s 1 on pose : 

*v) = n fe€ */[ p * s< (^ fc )i 
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où le produit est pris sur la famille Ki des ensembles d’information du joueur i. On 
fixe le comportement (pur) de —i et s 1 induit une partie qui travers les ensembles 
d’information P/ 5 , k G K[ C La probabilité de cette partie sous p, 1 est 

U k€Ki iï p î’ si ( p ^ 

et sous g % : {^^(s*); ^(P/ 5 ) = s l (P]f), k G K-}. Ces deux quantités coincident car un 
ensemble apparait au plus une fois dans K[. ■ 


La notion de mémoire parfaite signifie qu’un joueur ne perd pas d’information 
durant le déroulement du jeu. Celle-ci peut être décomposée en deux propriétés : 

i) le joueur ne perd pas d’information le concernant : il se rappelle de tout ce qu’il a 
fait ou non dans le passé. 

ii) le joueur ne perd pas d’information sur ce qu’il a su sur les autres ou sur la nature. 

Définition 2.3. Le jeu est à mémoire parfaite pour le joueur i si et seulement si pour 
tout couple (x,y) dans un même ensemble d’information Pf, si x 7 est un prédécesseur 
de x appartenant à un ensemble d’information P-j alors : 

- il existe y ' un prédécesseur de y tel que y 1 G Pf . 

- l’action qui mène de x' à x est dans la même classe d’équivalence que celle qui mène 
de y' à y. 

Il est facile de vérifier que mémoire parfaite implique linéarité mais le jeu 6.12 est 
linéaire sans mémoire parfaite. 


Théorème 2.4 (Kuhn, 1953). 

Si le jeu est à mémoire parfaite , pour tout joueur i et toute stratégie mixte o % il existe 
une stratégie de comportement p % telle que pour tout profil 9~ l des autres joueurs , les 
distributions induites P (/x\0~ z ) et P(cr î ,0“ t ) coincident sur R. 


Preuve : Soient Pi un ensemble d’information et s 1 une stratégie pure de i. On 
pose m{Pi) = {Es^( s O; P s\<mOPz) > 0} et m(Pï,c) = > 

0, S *(P*) = c}. 


On définit alors 


^ (Pu c) — 


m(Pj\ c ) 
m(Pi ) 


Soit t un noeud terminal et t la partie correspondante. La probabilité de t sous a % est 
m(Qi) où Qi est l’ensemble d’information contenant t. Soit Q £ la famille des ensembles 


d’information de i traversés le long de t. La mémoire parfaite implique que le pas- 
sage dans Qi +1 spécifie le choix c h d’où : p> l (Qi y c h ) = /jl l ( Q f +1 ). Donc la probabilité 
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évaluée avec (i 1 qui est 

rimV) 

induit un produit téléscopique qui se réduit à m(Qi) ■ 


Corollaire 2.5. 

Tout jeu fini , sous forme extensive et à mémoire parfaite pour tous les joueurs y est 
stratégiquement inchangé si les joueurs sont restreints à utiliser seulement leurs stra- 
tégies de comportement. En particulier , le jeu admet un équilibre de Nash en stratégies 
de comportement. 

Remarque 

L’espace des stratégies de comportement a en général une dimension beaucoup plus 
petite que celui des stratégies mixtes : Si le joueur i possède n ensembles d’information 
avec dans chacun d’eux deux actions, il a 2 n stratégies pures. La dimension de l’espace 
des stratégies mixtes est 2 n — 1 et celle de l’espace des stratégies de comportement 
est seulement n. 


3. Sélection d’équilibre 

Nous considérons désormais seulement des jeux à mémoire parfaite. 

3.1. Forme extensive. 

On veut étendre au cas de jeux à information imparfaite le critère de “rationalité” 
(au sens de la définition 1.6.) d’un profil de stratégies en tout noeud de l’arbre. Pour 
cela il faut pouvoir mettre une probabilité appelé croyance , sur les différents noeuds 
p dans un ensemble d’information Q afin de comparer les paiements induits par les 
différents choix. 

Si Q est “irrigué” par a (au sens où a atteint un noeud dans Q avec probabilité 
positive) la croyance peut être définie par la probabilité conditionnelle. Sinon on intro- 
duit un système de croyances f. i . p est une application qui associe à chaque ensemble 
d’information Q, une probabilité sur les éléments de Q. 

Définition 3.1. Le couple (cr, p) est un équilibre S-parfait si : 

- pour tout ensemble d’information Q, a est une meilleure réponse à (cr,/x) dans le 
jeu à partir de Q, précédé par un choix de la nature d’un noeud dans Q selon la dis- 
tribution /jb(Q). 

- pb est compatible avec a au sens où pour tout Q irrigué par a, la probabilité condi- 
tionnelle induite par a sur Q est pb(Q). 
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La définition précédente dépend de l’ensemble des croyances permis. Sans condi- 
tions supplémentaires on obtient les équilibres “weak Bayesiens parfaits” (Fudenberg 
et Tirole, 1991). 

Soit E* l’ensemble des stratégies du joueur i et E = Une stratégie est 

complètement mixte si toutes les parties ont une probabilité strictement positive (à 
chaque ensemble d’information, chaque joueur joue chaque action avec une probabilité 
strictement positive). Sur cet ensemble, noté int E, on n’a pas besoin de système de 
croyances car chaque ensemble d’information est atteint avec probabilité positive. Soit 
$ la correspondance associant à un profil de stratégies ex, la famille /x des croyances 
sur les ensembles d’information compatibles avec cr. Cette application est univoque 
sur intTi . Le jeu suivant montre que : 

Q(int E) ^ * (E) 


1 


FIG. 6.14. : Adhérence des croyances 

En effet si 1 joue (1— e, e) et 2 joue (l-£, e) la probabilité sur les noeuds (a, 6, c) de 
l’ensemble d’information de 3 est ((1 — e)e } e(l — e), e 2 ) et la croyance induite converge 
vers (1/2, 1/2,0). Mais tout profil de stratégies qui irrigue a et 6, irrigue ausi c. 

La notion suivante demande des conditions aux limites sur les stratégies et les 
croyances. 

Définition 3.2. Le profil a est un équilibre séquentiel si il existe cr n dans intT, conver- 
geant vers a tel que les croyances associées fjb n convergent vers /x et (cr, p) est un 
équilibre S -parfait 

Théorème 3.3 (Kreps et Wilson, 1982). 

L’ensemble des équilibres séquentiels est non vide. 



Preuve : Voir sous-section 3.3. 
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Remarques 

L’exemple ci-dessous montre qu’il n’y a pas de lien entre induction amont et optima- 
lité parétienne. Le seul équilibre 5-parfait est [(L,^);T] et induit le paiement (1,1) 
alors que [(i?., r)\B] est un équilibre de paiement (2,2). 



FIG. 6.15. : 5-parfait et Pareto 

L’exemple suivant est le fameux centipède de Rosenthal (1982). Par induction 
amont le seul équilibre 5-parfait conduit le joueur 1 à stopper le jeu immédiatement 
d’où le résultat (2, 1). Le “paradoxe” est que si l’intéraction dure sur plus de n posi- 
tions chaque joueur est sûr d’avoir au moins n. 

Par ailleurs l’argument qui force 2 à stopper si 1 continue repose sur un comportement 
rationnel hypothétique du joueur 1 dans le futur... 

Pour une approche non ambiguë, voir Aumann (1995, 1998). 



3.2. Forme normale. 

Les conditions qui correspondent à 5-parfait dans un jeu sous forme normale imposent 
l’élimination des stratégies faiblement dominées. 
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Dans cette optique, considérons l’approche suivante de sélection d’équilibre dans un 
jeu fini G sous forme normale. 

Définition 3.4. Soit e > 0. Un profil a £ est un équilibre e-parfait s’il est complète- 
ment mixte et si pour tout joueur i et toute stratégie pure s 1 du joueur i , si s 1 n’est 
pas une meilleure réponse à a £ alors cr l £ {s l ) < e. 

L’interprétation est que : 

1) toutes les actions sont possibles 

2) les joueurs font des erreurs mais les stratégies sous-optimales sont jouées avec des 
probabilités très petites. 

Définition 3.5. Un équilibre a est parfait s’il est limite d’une suite a n d’équilibres 
e n -parfait avec e n qui tend vers 0. 

Selten (1975) a introduit cette notion et en a montré l’existence. 

Pour tout r G intY, et tout e > 0 on définit le jeu perturbé G(r; e ) issu de G comme 
le jeu sur E de paiement a g(( 1 - e)a + et). Il admet un équilibre, qui est ^-parfait 
dans le jeu non-perturbé, voir Exercice 6.2. 

I Théorème 3.6 (Selten, 1975). 

Tout jeu fini possède un équilibre parfait. 

Cette notion élimine les équilibres dominés (i.e. qui contiennent dans leur support 
une stratégie faiblement dominée). En effet, une telle stratégie est sous-optimale dans 
tout équilibre e-parfait et est donc jouée avec une probabilité qui tend vers zéro quand 
e tend vers zéro. 

Dans le jeu 6.6 sous forme normale, seul l’équilibre S-parfait est parfait. 

Proposition 3.7. 

Dans un jeu à deux joueurs les équilibres parfaits sont les équilibres non-dominés. 
L’inclusion est stricte pour plus de deux joueurs. 

Myerson (1978) a introduit un raffinement des équilibres parfaits. 

Définition 3.8. Un profil a £ est un équilibre e -propre d’un jeu sous forme normale 
G s’il est complètement mixte et si, pour tout joueur i et toutes stratégies pures s % et 
i 1 dans S 1 , g % (t l ,a~ % ) > g l {s t ,a~' 1 ) implique cr*(s z ) < ea l e {t l ). 

Les joueurs font des erreurs d’une façon rationnelle au sens où une stratégie s % 
est jouée avec une probabilité beaucoup plus petite qu’une meilleure stratégie t l . 
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Définition 3.9. Un profil est un équilibre propre s’il est limite d’une suite d’équilibres 
e n -propre avec e n qui tend vers 0. 

Théorème 3.10 (Myerson, 1978). 

Tout jeu fini possède un équilibre propre. 

Preuve : voir Exercice 6.2. ■ 

Clairement, tout équilibre propre est parfait et donc est non dominé. 

L’inverse est faux. Dans l’exemple suivant : 


H 

M 

B 


g m d 


!M) i 

(0,0) 

(-1,-2) 

(0,0) 

(0,0) 

(0,-2) 

(-2,-1) 

(-2,0) 

(-2,-2) 


l’équilibre (H, g) est strict donc propre et parfait. 

Par ailleurs M est l’unique meilleure réponse à d donc M n’est pas faiblement domi- 
née. De même m est l’unique meilleure réponse à B. Donc l’équilibre (M,ra) est non 
dominé et par conséquent parfait. 

Cependant cet équilibre n’est pas propre. En effet, B et d sont deux stratégies stricte- 
ment dominées, par H et g respectivement. Donc pour tout équilibre ^-propre appro- 
chant (M,m), la stratégie H (resp. g) sera infiniment plus probable que la stratégie 
B (resp. d). Mais, face à une stratégie de la forme eg + (1 — e — e 2 )m + e 2 d y l’unique 
meilleure réponse du joueur 1 est de jouer H (et non M). 

On remarque que sans les stratégies strictement dominées B et d, l’unique équilibre 
parfait est ( H y g ). Ajouter des stratégies strictement dominées modifie l’ensemble des 
équilibres parfaits. 

Le même phénomène a lieu avec les équilibres propres. 


H 

M 

B 


L’équilibre (H y d) est propre. En effet, H est l’unique meilleure réponse à d . En 
perturbant d, H reste l’unique meilleure réponse. Si on perturbe H de la sorte : 
(1 — e — e 2 )H + e 2 M + eB y l’unique meilleure réponse du joueur 2 est de jouer d. 
Donc (if,d) est propre. Cependant, en éliminant B (strictement dominée), l’unique 
équilibre parfait qui subsiste est ( M y g ). 


g d 


(2,1) 

(2,1) 

(3,1) 

(0,0) 

(0,0) 

(1,3) 
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3.3. Liens forme extensive/forme normale. 

Définition 3.11. L’ u agent normal form” associée à un jeu sous forme extensive est le 
jeu sous forme normale où à chaque ensemble d’ information Q correspond un joueur 
i(Q) dont les paiement sont ceux du joueur qui joue à Q. 

Clairement chaque joueur joue au plus une fois dans chaque partie. 

I Théorème 3.12 (Kreps et Wilson, 1982). 

L’ensemble des équilibres séquentiels est non vide. 

Preuve : Partant de l’agent normal form, considérons le jeu perturbé où chaque joueur 
est restreint à jouer chacune de ses stratégies avec une probabilité au moins égale à 
e. Ce jeu contraint est un jeu qui satisfait aux hypothèses du théorème de Glicksberg 
et admet donc un équilibre de Nash a £ (indexé par e). Cet équilibre induit un 0(e)- 
équilibre dans le jeu non contraint, où à chaque ensemble d’information, le joueur qui 
joue maximise son gain à 0(£)-près étant donné sa croyance p, e induite par a £ . En 
prenant une sous suite convergente on obtient un équilibre séquentiel. ■ 

Définition 3.13. Un équilibre parfait d’un jeu sous forme extensive est un équilibre 
parfait de l’agent normal form. 

La compatibilité avec la perfection dans les deux représentations est impossible : 
Dans le jeu suivant (i?i; a) est clairement ANF parfait mais non parfait. 



FIG. 6.17. : parfait ANF et non NF 


Dans le jeu suivant Tt est parfait sous forme normale mais pas ANF. 


1 




0 


FIG. 6.18. : parfait NF et non ANF 
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Cependant le résultat suivant établit un lien important entre les deux formes. 


Théorème 3.14 (van Damme, 1984; Kohlberg et Mertens, 1986). 

Un équilibre propre a d’un jeu sous forme normale G induit un équilibre séquentiel r 
dans tout jeu sous forme extensive ayant la forme normale G. 


Preuve : a est une limite d’une suite d’£ n -équilibres propres a n . Soit y n une stratégie 
de comportement complètement mixte équivalente à a n . Tout ensemble d’information 
a une probabilité positive sous y n . Soit y la limite de y n et pour chaque n, soit /x n 
le système de croyances associé à y n . Soit Q un ensemble d’information du joueur i 
et montrons qu’il y joue une meilleure réponse face à (y,/i(Q)). Sinon il existe une 
action b 1 strictement meilleure qu’une action à 1 jouée avec probabilité positive par y 1 
à Q. Cela devrait donc être aussi le cas face à y n pour n grand. Ceci contredirait le 
fait que x n est £ n -propre car le poids de toute stratégie pure induisant ai en Q est au 
plus e n celui de la stratégie pure identique sauf en Q où elle dicte b 1 . ■. 

Ce résultat est remarquable en ce qu’il montre que l’induction amont (propriété 
de la forme extensive) peut être détectée par un raffinement de la forme normale. 


3.4. Induction aval et introduction à la stabilité. 

Dans la définition du concept d’équilibre S-parfait (induction amont), chaque joueur 
regarde vers le futur et son comportement est indépendant des choix effectuées dans 
le passé. Chaque joueur anticipe, pour chacune de ses positions aujourd’hui, les consé- 
quences d’un comportement rationnel des autres joueurs et de lui même dans la suite 
du jeu. Puis il utilise ces anticipations pour faire un meilleur choix aujourd’hui. Son 
raisonnement est effectué indépendamment de l’histoire passée. 

La notion d ’ induction aval , introduite par Kohlberg et Mertens (1986), consiste 
à interpréter les actions passées afin de sélectionner parmi les différents équilibres 
futurs. Ceci peut s’avérer parfois très puissant. 

Le jeu suivant se déroule en deux étapes. 
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1 

( 2 , 4 ) 




3,1 

0,0 

0,0 

1,3 


FIG. 6.19. 


A la première étape le joueur 1 a le choix entre arrêter (et obtenir 2) ou continuer 
et alors les 2 joueurs jouent un jeu simultané du type “bataille des sexes”. La forme 
normale est la suivante : 


5 
T 
B 

(5, B.) est un équilibre propre mais B est dominée. 

Si le joueur 1 ne joue pas S le joueur 2 devrait en déduire qu’il vise un paiement 
plus grand que 2 ; mais alors le seul équilibre dans le sous jeu compatible avec cette 
exigence est (T, L) induisant (3,1), ce qui justifie alors la déviation du joueur 1. 

Cependant il peut y avoir conflit entre des approches intuitives de type “backward” 
et “forward” induction comme dans le jeu suivant : 


L R 


(2,4) 

(2,4) 

(3,1) 

(0,0) 

(0,0) 

(1,3) 


l'i 


2 1 

3,1 

0,0 



0,0 

1,3 


( 0 , 2 ) ( 2 , 4 ) 


FIG. 6.20. 


L’analyse précédente du sous jeu conduit à l’issue (3,1) donc le joueur 2 devrait stop- 
per immédiatement. Par ailleurs, si il continue, il délaisse un paiement de 2 et indique 
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ainsi son intérêt pour le seul équilibre (£, R) du jeu simultané. Face à cela le joueur 
1 joue S et alors le joueur 2 obtient 4 ce qui justifie alors sa déviation. 

Kohlberg et Mertens (1986) considèrent un ensemble minimal C d’équilibres de 
Nash tel que tout jeu perturbé admet un équilibre proche de C. 

Si la perturbation porte sur les paiements on obtient une composante essentielle mi- 
nimale, modulo le fait que l’on veut qu’elle le soit pour tout jeu ayant la même forme 
normale réduite. Cependant ce concept impose de conserver des équilibres non admis- 
sibles : 


T 
B 

(T, B) est dominé mais correspond à un équilibre strict pour un jeu dans un voisinage. 

Un autre concept de voisinage consiste à considérer un sous ensemble convexe 
compact £(5) de l’ensemble des stratégies mixtes dont le complémentaire soit un Æ- 
voisinage de la frontière et l’ensemble des équilibres du jeu contraint correspondant 
puis sa limite supérieure. Là encore on perd l’admissibilité : 


T 
B 

B. devient admissible si elle est moins perturbée vers Z que L. 

Une approche alternative est pour tout (e, a G inŒ) de considérer le jeu perturbé 
G(cr> e) au sens de Selten et le voisinage qu’il engendre. 

Mertens (1989, 1991) montre alors qu’en imposant de plus des propriétés à la pro- 
jection de la variété des équilibres sur la base, on peut identifier une composante 
“stable” qui est non vide, connexe, invariante, admissible, satisfait induction amont 
et aval ainsi que d’autres propriétés importantes. 

Sur ce sujet voir aussi les surveys de Hillas et Kohlberg (2002) et de van Damme 
(2002). 


L R Z 


( 2 , 2 ) 

( 2 , 2 ) 

( 0 , 0 ) 

( 1 , 1 ) 

( 0 , 0 ) 

( 0 , 0 ) 


L R 


( 2 , 2 ) 

( 2 , 2 ) 

( 1 , 1 ) 

( 0 , 0 ) 
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Equilibres corrélés, apprentissage, équilibres 

bayésiens 

1. Equilibre corrélé 

Cette section est consacré à l’équilibre corrélé, qui est une extension, due à Au- 
mann (1974), de l’équilibre de Nash et qui a de bonnes propriétés stratégiques, géo- 
métriques et dynamiques, voir Section 2. 

1.1. Exemples. 

Considérons la classique “bataille des sexes” : 


3,1 

0,0 

0,0 

1,3 


Il y a 2 équilibres purs efficients et disymétriques et un équilibre mixte symétrique et 
Pareto dominé. L’utilisation d’une pièce permet d’obtenir un équilibre symmétrique 
et efficient : si “pile” l’issue est (3, 1) et (1,3) si “face”. Il est clair que face à un tel 
contrat aucune déviation n’est profitable. Ce mécanisme peut être représenté par la 
distribution suivante sur les profils d’actions : 


1/2 

0 

0 

1/2 


Considérons maintenant le jeu de paiements : 


g 

d 

H 

2,7 

6,6 

B 

0,0 

7,2 


Soit un espace de signaux : (£?, G, AT), muni de la probabilité uniforme (1/3, 1/3, 1/3). 
On suppose que les joueurs reçoivent des messages privés et que 1 connait a = {B, G} 
ou b = {N} et 2 connait a = {£} ou (3 = {G, N} 

Considérons les stratégies : 
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H si a, B si b pour le joueur 1 ; 
g si a, d si /3 pour le joueur 2. 

Elles induisent sur l’espace d’actions S la matrice de corrélation : 


1/3 

1/3 

0 

1/3 


et aucune déviation unilatérale n’est profitable. 


1.2. Structure d’information et jeu étendu. 

Définition 1.1. Une structure d’information X est la donnée : 

- d’un ensemble d’événements alâtoires représenté par un espace de probabilité 

(n,A,P) 

- d’une famille d’applications mesurables 6 l de (£},.À) dans A (ensemble de signaux 
du joueur i) (ou d’une sous a -algèbre A 1 ; dans le cas fini , une partition de fi J. 

Soit G défini par g : S = 11*5* — > IR 71 un jeu stratégique. 

Définition 1.2. Le jeu G étendu par X , noté [G, Z] est le jeu sous forme extensive 
joué en 2 étapes : 

étape 0 : la variable aléatoire u ; est tirée suivant la loi P et le signal 0*(a;) est envoyé 
au joueur i. 

étape 1 : les joueurs jouent dans le jeu G. 

Une stratégie o % du joueur i dans le jeu [G, Z] est une application (mesurable) de 
A 1 dans 5* (ou une application ,4*-mesurable de fi. dans S 1 ). A et 5* sont ici munis 
de tribus (dans le cas fini, la tribu discrète). 

Un profil a de telles stratégies est appelé une stratégie corrélée . 


1.3. Equilibre corrélé. 

Définition 1.3. Un équilibre corrélé de G est un équilibre de Nash d’un jeu étendu 

[G, A- 

Un profil a de stratégies dans [G, Z] transporte la probabilité P sur fi en une 
probabilité Q(cr) sur 5 via la suite : aléa — > signal — > action. 
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Explicitement pour tout cj, Q(cj,ct) est la probabilité produit sur S égale à 
n^Ww)) et Q(cr) est l’espérance par rapport à la probabilité sous-jacente P. 

Définition 1.4. DEC (G) est V ensemble des distributions d’équilibres corrélés dans 
G : 

DEC{G) = U z,a{Q(cr);cr équilibre dans [G,X]} 

Noter que DEC(G) est un ensemble convexe : il suffit de considérer la combinai- 
son convexe des structures d’information. 

1.4. Corrélés canoniques. 

Définition 1.5. Une structure d’information canonique pour G correspond au cas : 

n = s ; e i :S-^s\e i (s) = s i . 

Cela signifie que P est une probabilité sur le produit S des espaces d ’ actions et chaque 
joueur est informé de sa composante. 

Un équilbre corrélé canonique est un équilibre de G étendu par une structure d’infor- 
mation canonique et où les stratégies d’équilibre sont données par 

a î (uj) = cr l (s) = <J l (s l ) = s l 

U chaque joueur suit son signal 11 . 

La distribution d’équilibre corrélé canonique ( DECC ) associée est évidemment 
P. 

Théorème 1.6 (Aumann, 1974). 

DECC(G) = DEC(G) 
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Preuve : Soit a un profil d’équilibre dans une extension [G, Z] et Q = Q(cr) la distri- 
bution induite. 

Alors Q est aussi une DECC(G). En effet on donne à chaque joueur i moins d’infor- 
mation : son coup au lieu du signal à 1 tel que a l (à l ) = s*. Or s 1 est une meilleure 
réponse à la stratégie (correlée) de — i conditionnelle à à 1 . Il suffit alors d’utiliser la 
convexité de B B 1 sur A ■ 

1.5. Caractérisation. 

Théorème 1.7. 

Q G DEC (G) s’écrit : 

VsV* € S\Vi = 1 > 0. 

Preuve : On peut supposer que Q G DECC(G). Si s 2 est annoncée (i.e. sa margi- 
nale Q l (s l ) = J2s-iQ( sl i s ~ l ) > 0) on introduit la distribution conditionnelle sur 
^(.Is 1 ), et la condition d’équilibre s’écrit 

s* e B&iQUs*). 

s 1 est une meilleure réponse du joueur i à la distribution conditionnelle à s 1 des coups 
des autres joueurs. ■ 

L’approche en termes d’équilibre de Nash du jeu étendu est une approche “ex- 
ante”. La caractérisation précédente correspond à un critère “ex-post”. 

Corollaire 1.8. 

L ’ ensemble des distributions d ’ équilibres corrélés est l ’ enveloppe convexe d ’un nombre 
fini de points. 

Preuve : Il est défini dans A (S) par une famille finie d’inégalités linéaires larges. ■ 

1.6. Commentaires. 

On peut donner une démonstration élémentaire d’existence d’équilibre corrélé via le 
théorème du minmax, voir Hart and Schmeidler (1989) et Exercice 8.4. 

Il existe des distributions d’équilibres corrélés en dehors de l’enveloppe convexe des 
distributions d’équilibre de Nash. En effet, considérons le jeu 


0,0 

5,4 

4,5 

4,5 

0,0 

5,4 

5,4 

4,5 

0,0 
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Le seul équilibre est symétrique et induit par la stratégie (1/3, 1/3, 1/3) avec paiement 
3. 

Mais une distribution d’équilibre corrélé est : 


0 

1/6 

1/6 

1/6 

0 

1/6 

1/6 

1/6 

0 


induisant le paiement 9/2. 

Considérons les équilibres corrélés dans un jeu sous forme extensive. 

Le joueur 1 choisit entre arrêter, et le paiement est (2,2) ou continuer et le jeu est 
alors le suivant : 


5,1 

0,0 

0,0 

1,5 


(3,3) est un paiement d’ équilibre si le signal public (1/2, 1/2) sur (a, b) (avec la 
convention (5, 1) après a et (1, 5) après b) est tiré après le choix initial du joueur 1, 
mais pas si il est connu avant, car alors le joueur 1 dévie si le signal est a. 

Pour l’étude des équilibres avec des mécanismes plus généraux voir Forges (1986, 
1990). 


2. Procédures de non regret 


Soit {U n } une suite de vecteurs dans U = [0, 1] K . A chaque étape n, un joueur 
ayant observé les réalisations précédentes {t/i, ..., t/ n _i} et ses choix passés, choisit 
une composante k n dans K. Le résultat correspondant est u n = U% n . 

Une stratégie a dans ce problème de prédiction spécifie à l’étape n, la loi de k n étant 
donné le passé h n -\ = {fci, ..., fc n _i, U n - 1 }, notée a(h n -\) G A (K). 

Le regret interne à l’étape n est donné par la matrice S n = {S^ e }k,eeK définie par : 


S** 

n 


Un ~ U% Si k = k, 

0 sinon. 


Le regret moyen est alors la matrice donnée par : 




J m=l,k in =k 


(Ufn-Ui). 


La composante kt compare le paiement moyen du joueur sur les étapes où il a joué k 
au paiement qu’il aurait eu si il avait joué £ à toutes ces étapes. 
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Définition 2.1. Une stratégie a définit une procédure de non regret si pour tout 
processus {U m } et tout couple k,t : 

kg . 

[5 n ] + — > 0 quand n — >• -foo a — p.s. 

Etant donné A, une matrice K x K à coefficients > 0, il existe une mesure inva- 
riante p G A (K) i.e. vérifiant : 

y p k A^ = ^y A ik Vie K. 

^ A-^keK 

(Cela suit facilement de l’existence d’une mesure invariante pour une matrice stochas- 
tique.) 

Proposition 2.2. 

Soit 5(.,t/) la matrice de regret associée à un vecteur U. Pour toute matrice A (de 
taille K x K) et toute mesure p, invariante pour A 

(A,Ep(S(.,U)))= 0, VU eU. 

Preuve : 

(A,E fl (S(.,U))) = ^2 ke A ke n k (U e -U k ) 

et le coefficient de chaque U e est 

y n k A ke - n* y A ek = o. 

t-^keK ^ *-^k€K 

■ 

On rappelle le théorème de Blackwell (1956), voir Exercice 3.3., appliqué ici dans 
le cadre de l’ensemble convexe fermé D = IPfii : 

Théorème 2.3. 

Soit x n une suite de variables aléatoires dans lR n tel que 

(x n - U D (x n ),y n+ i - U D (x n )) < 0. 

où y n + 1 = E(x n +i\xi, ... y x n ) est Uespérance conditionnelle de x n +\ étant donné le 
passé , et Ilp dénote la projection sur D. Alors la distance de x n à D tend vers 0 
presque sûrement. 

On en déduit : 

Proposition 2.4. 

Il existe des procédures de non regret. 

Preuve : Considérons le processus des regrets généré par g dans M 

^n+l — S n = —— [S n+ i — Sn] 

n + 1 
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avec cr(h n ) = n(S+). 

La condition suffisante d’approchabilité de l’orthant négatif D s’écrit : 

(S n — n D (5 n ), Æ(5 n+ i|£i, •••, S n ) — U D (S n )) < 0 . 

Ici on a Hd(x) = —x~ orthogonal à x + = x — Hd(x) d’où la condition : 

(S+,E P (S(.,U n+1 ))) < 0 

qui est vérifiée pour P = cr(h n ) = /z(5+), d’après la Proposition 2.2, avec A = 


Considérons un jeu G joué de manière répétée où à chaque étape les actions choi- 
sies sont révélées aux joueurs. Chaque joueur i fait face à l’étape n à un paiement 
vectoriel (inconnu) Vg l (s~ l ) = {g l (s l , s~ l ) 3 i eS i} déterminé par le comportement des 
autres joueurs. 

Proposition 2.5. 

Si chaque joueur i suit une procédure de non regret associée à son paiement vecto- 
riel, U n (ï) = Vg l (s~ l ), la distance de la distribution empirique des coups à DEC(G) 
converge vers 0. 

Preuve : Il suffit de remarquer que si Q* est un point d’accumulation de la suite des 
répartitions empiriques d’actions 

Q*(s ) = lim (—#{1 <m<n k \s m = s}), 

n/e— XX) njz 

la condition de non regret (5 fe ^) + < 0 s’écrit, par linéarité du paiement : 

£ s - i€S -MM _i ) - > o 

qui est la définition de l’équilibre corrélé. ■ 

En particulier ce résultat implique l’existence de DEC et fournit un algorithme 
(composée de procédures unilatérales) convergeant vers cet ensemble. 

Il n’existe pas de telles propriétés pour l’équilibre de Nash. Pour un survey récent sur 
ce sujet, voir Hart (2005). 

3. Jeux à information incomplète (ou “jeux bayésiens”) 

3.1. Stratégies, paiements et équilibre. 

Comme dans la Section 1 précédente, on a une structure d’information X = (fl, A , P), 
mais le jeu lui-même T = G(.) dépend de u (on peut également permettre à S 1 de 
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dépendre de u mais de manière ^-mesurable). 

On appelle parfois espaces des types, l’ensemble (fini) des signaux A 1 (chaque joueur 
connaît son type). 

Une stratégie g % du joueur i est une application de A 1 dans A (S 1 ). Le paiement cor- 
respondant à un profil a est donné par 

7(o-) = / 3({c rl (^(w))}i6/;w)P(dw) 

J U) 

On note Q la probabilité induite sur A = Il iA et #(., a) V espérance conditionnelle de 
#(., co) sur 0~ 1 (a ), l’ensemble des aléas se traduisant par le profil de signaux a. Alors 
le paiement s’écrit encore 

7(<0 = £ a 0({*V)};<*)Q(®) 

soit pour le joueur i 

7 < w = E,,«‘(«W) 

avec 

*V) = E 0 -, » W), a)Q{a-y). 

Donc si a est un profil d’équilibre, pour chaque joueur i et pour chaque signal à \ 
a l (a l ) maximise le gain “bayésien” face à a~ l : 

T'a- A- 

La première maximisation (dans 7) est “ex-ante”, la seconde “ex-post”. 

3.2. Compléments. 

Une stratégie pure (resp. de comportement) du joueur i envoie A 1 dans S 1 (resp. 
A(S% 

Une stratégie mixte est une distribution sur les stratégies pures ou bien une applica- 
tion de A 1 x [0, 1] dans S 1 où [0, 1] est muni d’une distribution uniforme. 

Une stratégie de distribution \x % est un élément de A(A l x S 1 ) qui respecte les données : 
la marginale sur A 1 est égale à Q l (Milgrom and Weber, 1985). 

La probabilité conditionnelle /x 2 (.| à 1 ) correspond à une stratégie de comportement. 

Applications : 

i) Chaque joueur fait face à une stratégie mixte même si ses adversaires utilisent des 
stratégies pures, mais basées sur des informations privées (Harsanyi, 1973a). 

ii) Phénomènes de réputation : ce domaine correspond à l’étude des situations où un 
joueur utilise stratégiquement l’incertitude de son adversaire sur son type, voir par 
exemple une présentation dans Sorin (1999). 



CHAPITRE 8 


Introduction aux jeux répétés 


Les jeux répétés représentent les interactions dynamiques en temps discret. Ces 
interactions sont modélisées à l’aide d’une variable d’état, évoluant selon un proces- 
sus contrôlé par les joueurs. Concrètement, le jeu se déroule par étapes, et chaque 
joueur commence par recevoir un signal privé sur l’état initial. Puis à chaque étape, 
les joueurs choisissent simultanément une action. Les actions choisies ainsi que l’état 
courant déterminent : 1) les paiements d’étape, et 2) une probabilité de transition sur 
le nouvel état et les nouveaux signaux reçus par les joueurs. 

C’est un modèle très général, et lorsqu’un joueur choisit son action à une certaine 
étape, de nombreux aspects stratégiques peuvent être simultanément présents : 1) le 
joueur peut influencer son propre paiement, 2) il peut influencer le processus des états 
(cet aspect est essentiel dans la classe des jeux stochastiques ), 3) il peut révéler ou 
apprendre des informations sur l’état courant (cet aspect est essentiel dans la classe 
des jeux répétés à information incomplète ), et enfin 4) il peut influencer les connais- 
sances des joueurs sur le profil d’actions joué à cet étape (cet aspect est essentiel dans 
la classe des jeux répétés observation imparfaite , ou avec signaux). 

A l’exception de la dernière section, on se restreint ici au cas le plus simple, celui 
des jeux répétés “non stochastiques à information complète et observation parfaite” : 
simplement, on répète le même jeu “de base” connu de tous les joueurs, et après chaque 
étape les actions jouées sont observées. On va présenter un certain nombre de “Folk 
théorèmes” : ces résultats caractérisent l’ensemble des paiements d’équilibres du jeu 
répété en fonction des données du jeu de base. Indiquons qu’une partie de ce chapitre 
repose sur le survey de Forges, Renault, Sorin et Vieille (2006). 


1. Exemples élémentaires 

On considère un jeu répété un nombre fini T de fois, les paiements des joueurs 
étant donnés par la moyenne arithmétique des paiements des différentes étapes. Re- 
poussons à la section suivante les définitions formelles, et notons dès maintenant Et 
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l’ensemble des paiements d’équilibres de Nash en stratégies mixtes du jeu répété T fois. 
Exemple 1. Le jeu de base est : 

G D 

H f (1,0) (0,0) \ 

B (0,0) (0,1) ) 

(1, 0) et (0, 1) sont des paiements d’équilibre de Nash du jeu de base. On peut alors fa- 
cilement construire un équilibre du jeu en deux étapes de paiement moyen (1/2, 1/2) : 
les deux joueurs jouent (iJ, G) à l’étape 1, et (B,D) à l’étape 2. 

D’ où (1/2, 1/2) G # 2 * La répétition permet de convexifier les paiements. 

Exemple 2 . Le jeu de base est : 

C 2 D 2 L 2 

C 1 / (3,3) (0,4) (-10,-10) \ 

D 1 (4,0) (1,1) (-10,-10) 

L 1 \ (- 10 ,- 10 ) (- 10 ,- 10 ) (- 10 ,- 10 ) / 

L’ensemble des paiements d’équilibres du jeu de base est : E\ = {(1, 1), (—10, —10)}. 
On peut construire un équilibre de Nash du jeu en deux étapes de paiement (2,2) de 
la façon suivante. 

A la première étape, le joueur 1 joue C l et le joueur 2 joue C 2 . A la seconde 
étape, le joueur 1 joue D 1 si le joueur 2 a joué C 2 en date 1, et il joue l’action L 1 
(que l’on peut ici interpréter comme une punition ) sinon. Symétriquement, à l’étape 
2 le joueur 2 joue D 2 si le joueur 1 a joué C 1 en date 1, et il joue L 2 ( punition ) sinon. 
Il est facile de voir que l’on a bien défini un équilibre du jeu répété, et donc on a : 
( 2,2 )eE 2 . 

Dans la même veine, on peut montrer que pour tout T > 1, on a : ^^(3,3) 4* 
^(1,1) G Et . Ainsi la répétition peut-elle permettre la coopération. 

Exemple 3. Le jeu de base est le célèbre “dilemme du prisonnier". 

C 2 D 2 

C 1 ( (3,3) (0,4) \ 

Z? 1 ^ (4,0) (1,1) ) 

On peut montrer par récurrence que Et = {(1,1)} pour tout T. Il n’y a pas de 
coopération possible dans ce jeu répété un nombre fini de fois, Sorin (1986a). 
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2. Le modèle 

On fixe un jeu sous forme stratégique fini G = (TV, (S^ew, (c^eyv), appelé jeu 
de base. TV est l’ensemble des joueurs. Pour chaque joueur i de TV, S 1 est l’ensemble 
d’actions du joueur i et g % est une application du produit cartésien & dans 

JR donnant le paiement du joueur i. On s’intéresse à la répétition en temps discret, 
un grand nombre ou une infinité de fois, du jeu de base. Cette durée est connue 
des joueurs. A chaque étape les joueurs choisissent, éventuellement aléatoirement, si- 
multanément chacun une action dans leur ensemble d’actions, puis ces actions sont 
observées publiquement avant de passer à l’étape suivante. On note classiquement 
S = YliçivS* l’ensemble des profils d’actions, g = (g^ieN la fonction de paiement 
vectoriel et A(5), resp. A(S' t ), est l’ensemble des probabilités sur 5, resp. sur S \ 

2.1. Histoires et parties. 

On définit l’ensemble des histoires de longueur t comme l’ensemble H t des t-uplets 
(si, ...,s t ) d’éléments de 5, Hq étant le singleton {0}. 

H T ={( Sl ,...,s T )yt s t eS} = S T . 

L’ensemble de toutes les histoires est H = U t >oH t) et Hqq = S°° désigne l’ensemble 
des parties du jeu répété, i.e. des suites (si, ..., s t , ...) d’éléments de S. 

2.2. Stratégies. 

( Définition 2.1. Une stratégie (de comportement) du joueur i est une application a % 
de H dans A (S 1 ). 

L’interprétation est la suivante : pour tout h dans H u cr l (h) désigne la loi sur S 1 
qu’utilise le joueur i pour choisir son action en date t + 1 si l’histoire h a été jouée 
aux dates 1 ,..., t. 

On note l’ensemble des stratégies du joueur i et E = Y[ ieN E z l’ensemble des profils 
de stratégies. 

Un profil g induit alors naturellement par récurrence une probabilité sur l’ensemble 
(dénombrable) des histoires Ü, les tirages aléatoires effectués par les joueurs à chaque 
étape étant indépendants. Cette probabilité s’étend de façon unique, par le théorème 
de Kolmogorov, à l’ensemble des parties (qui est muni de la tribu produit sur 
S°°). 

2.3. Paiements. 

Passons maintenant à l’évaluation des paiements dans le jeu répété, s t désignant la 
variable aléatoire du profil d’actions joué en date t. 
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Plusieurs variantes de jeu répété sont classiquement étudiées : les jeux répétés un 
nombre fini de fois, les jeux escomptés, et les jeux uniformes (on dit aussi jeux non 
escomptés) . 

Jeux finiment répétés Gt • 

Définition 2.2. Le paiement moyen d’un joueur i jusqu’à une étape T > 1 si le profil 
de stratégies a est joué est : 

Pour T >1, le jeu répété T fois est le jeu Gt = ( TV , (E^çw, ( 7 t)ï€n)* 

Jeux escomptés G\. 

Définition 2.3. Pour À dans (0,1], le jeu escompté au taux À est G\ = 
(TV, (E^çw, (l\)ieN), où pour tout profil de stratégies a : 

l\{°) = E a (a£“ x (1 - XŸ - l g\s t )) . 

Dans cette version, gagner un paiement de 1 — À aujourd’hui est équivalent à 
recevoir le paiement 1 demain. Par ailleurs, remarquons que prendre T — 1 dans la 
définition 2.2 ou À = 1 dans la définition 2.3 revient à considérer le jeu “en un coup’”G. 

Jeux uniformes Gqq. 

On s’intéresse ici directement aux aspects stratégiques de long terme. L’approche 
uniforme consiste à définir la notion d’équilibre de la façon suivante : 

Définition 2.4. Un profil de stratégies a est un équilibre uniforme de Gqq si : 

1) Ve > 0 , a est un e-équilibre de Nash de tout jeu finiment répété assez long , 
i.e. : 

3T 0 , VT > T 0 , Vî G TV, Vr* G E*, 7 a"*) < 7 ^((j) + e, et 

2) (( 7 T( a ))i£N) T converge vers un vecteur y(a) de 1R . N , qui s’appelle alors un 
paiement d’équilibre (uniforme) de G^. 

On note l’ensemble des paiements d’équilibres de G 0 et Et (resp. E\) l’en- 
semble des paiements d’équilibres de Nash de Gt (resp. G\). On peut appliquer le 
théorème de Nash-Glicksberg à Gt et G\ : Et et E\ sont compacts et non vides. 
On montre facilement que Eqq est également compact, et on a : E\ C Et C E qo, et 
^lC^AC Eoo. 
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3. Les paiements réalisables et individuellement rationnels 
Définition 3.1. L’ensemble des paiements réalisables du jeu est con vg(S) = 

Comparer à Chapitre 4, Section 9. 

C’est un polytope qui représente l’ensemble des paiements que l’on peut obtenir dans 
le jeu répété. Par convexité et compacité, il contient E oo, et donc Et et E\. 


Définition 3.2. Pour chaque joueur i de N, on déjînit le niveau de punition du 
joueur i comme : 

v l — min max q l (x l , x~ % ). 

*-*€ll if «A(Si) * 4 €A(S<) 

Attention : s’il y a au moins 3 joueurs on peut avoir min max ^ max min (voir 
Exercice 2.2). 


Définition 3.3. L’ensemble des paiements individuellement rationnels est : 
IB, = { u = (u% eN , u 1 >v { Wie N}. 

L ’ensemble des paiements réalisables et individuellement rationnels est 

E = (conv g(S)) fl IB.. 


Etant donné un profil de stratégies a~ x des joueurs autres que i , il est facile de 
construire, en utilisant le fait que les actions sont observées après chaque étape, une 
stratégie cr 1 du joueur i telle que : VT, 7 ^(cr*, cr _z ) > v l . On en déduit que E oo, Et et 
E\ sont inclus dans E. 


Illustrons les définitions précédentes sur le dilemme du prisonnier. 



C 2 

D 2 

c 1 

( (3,3) 

(0,4) 

D 1 

V (4,0) 

(1,1) 


On a v l = v 2 = 1, et l’ensemble des paiements réalisables et individuellement ration- 
nels est représenté ci-dessous : 
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4. Les Folk théorèmes 

Les Folk théorèmes s’intéressent aux jeux répétés joués par des joueurs très pa- 
tients, et donc aux jeux Animent répétés ayant un grand nombre d’étapes, aux jeux 
escomptés avec un taux d’escompte proche de 0, et aux jeux uniformes. Ils énoncent es- 
sentiellement ceci : l’ ensemble des paiements d’équilibres du jeu répété est l’ensemble 
des paiements réalisables (i.e. que l’on peut obtenir en jouant) et individuellement 
rationnels (i.e. tels que chaque joueur a au moins son paiement de punition). Les 
versions les plus claires concernent les jeux uniformes. 

4.1. Les Folk théorèmes pour G qq. 

Théorème 4.1. “Le” Folk théorème 

L’ensemble des paiements d’équilibres de G 0 0 est l’ensemble des paiements réali- 
sables et individuellement rationnels : = E. 

Le nom signifie théorème de la communauté, car il est difficile d’établir la pater- 
nité de ce résultat élémentaire. Citons R. J. Aumann en 1981 : The Folk theorem “ 
has been generally known in the profession for at least 15 or 20 years, but has not 
been published ; its authorship is obscure. ” Il est appelé aussi le théorème du “tout est 
possible” : n’importe quel paiement raisonnable peut s’obtenir à l’équilibre. 

Preuve : Il faut montrer que E C E oo- Soit u G E. u est réalisable, donc il existe une 
partie h = (si, ..., s ty ...) telle que pour tout joueur i y ^ oo u 1 . 

On appelle h le plan principal de la stratégie, et jouer selon h pour un joueur 
i en date t signifie jouer la i-è me composante de s t . Pour chaque couple de joueurs 
distincts (i y j) y fixons x M dans A (S j ) tel que ( réalise le min dans l’expression 
de v % . Fixons maintenant un joueur i dans AT, et définissons une stratégie cr\ 
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g % joue en date 1 selon le plan principal, et continue de jouer selon h tant que 
tous les autres joueurs le font. Si à une certaine date t > 1, pour la première fois un 
joueur j ne joue pas selon le plan principal, alors a % joue à toutes les dates ultérieures 
la probabilité x^ % (si pour la première fois à la même date plusieurs joueurs sortent 
du plan principal, on punit celui de ces joueurs qui est le plus petit, selon un ordre 
total sur N préalablement fixé). Il est facile de voir que a = (a^ieN est un équilibre 
de G 0 o de paiement u. ■ 

Certains des équilibres construits via le Folk théorème peuvent être critiqués car 
rien n’assure qu’un joueur i aura intérêt, le cas échéant, à punir un joueur j qui vient 
de quitter le plan principal pour la première fois. On peut alors s’intéresser à la notion 
suivante d’équilibre sous-jeux parfait (ES JP). 

Etant donnés une histoire h de H et un profil de stratégies cr, on définit la stratégie 
de continuation a[h] comme le profil de stratégies r = (r^çyv, où : Vî G TV, V/i' G il, 
T l (h!) = G l (hh!), où hh' est l’histoire h suivie de h'. 

Un ESJP de G 0 0 est alors par définition un profil de stratégies a dans E tel que pour 
toute histoire h dans i7, a[h] est un équilibre de G^ ; et on note E ^ l’ensemble des 
paiements de ces équilibres. On a : E ^ C Eqq = E. 

En 1976, Aumann et Shapley, ainsi que Rubinstein, ont démontré, avec de légères 
différences de formulation (voir les éditions de 1994), que ce raffinement d’équilibre 
ne changeait en fait absolument rien ici. 

Théorème 4.2 (Aumann et Shapley (1994), Rubinstein (1994)). Folk théorème 
parfait 

E' — E — E 

^oo ~ -^oo — - C/ * 

Preuve : 

La preuve se résume là aussi à construire un ESJP à partir d’un paiement réali- 
sable et individuellement rationnel. Par rapport à la preuve du Folk théorème, il faut 
modifier la phase de punition. Si à une certaine date t, les joueurs jouaient selon le 
plan principal et le joueur j en sort, les joueurs — j se mettent à punir le joueur j 
jusqu’à une certaine date £, puis quoiqu’il arrive tout le monde oublie tout et revient, 
comme à l’étape 1, au début du chemin principal. 

Une possibilité est de calculer, à la fin de l’étape t, le nombre i de manière à ce 
que le paiement moyen espéré du joueur j jusqu’à la date £, soit inférieur à à + 1/t. 
Une autre possibilité est de prendre simplement t = 2t. ■ 
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4.2. Les Folk théorèmes escomptés. 

Passons maintenant aux paiements d’équilibres escomptés et reprenons l’exemple du 
dilemme du prisonnier avec un taux d’escompte À G (0, 1]. 

Déterminons si (3, 3) G E\ . Jouer D % pour la première fois peut augmenter à une 
étape le paiement du joueur i de 1, pour perdre ensuite à chaque étape au moins 2. On 
aura donc un équilibre de paiement (3, 3) dans G\ si : 1 < 2 A)* = 2(1— A)/A, 

soit si les joueurs sont suffisamment patients au sens où A < 2/3. 

En général, on a toujours E\ C .Eoo = E, et la question se pose de la convergence 
de E\ vers E. Cette convergence s’entend au sens de la distance de Hausdorff entre 
compacts de 1R. N , donnée par d(A, B) = max{sup aGi4 inf beB d(a , b), sup 6€B inf a€ A d(a, b)}. 

Le contre-exemple suivant à trois joueurs est dû à Forges, Mertens et Neyman 
(1986) : 

( ( 1 , 0 , 0 ) ( 0 , 1 , 0 ) \ 

V (0,1,0) (1,0,1) )' 

Le joueur 1 choisit la ligne, le joueur 2 choisit la colonne et le joueur 3 n’a qu’une 
stratégie et donc ne choisit rien ici ! Ce jeu est essentiellement un jeu “à somme nulle” 
entre les joueurs 1 et 2, et dans tout équilibre de G\ chacun de ces joueurs choi- 
sit, indépendamment à chaque étape, ses deux actions avec probabilité 1/2. Donc 
E\ = {(1/2, 1/2, 1/4)}, alors que (1/2, 1/2, 1/2) G E , et on n’a pas en général la 
convergence de E\ vers E. On a toutefois le résultat suivant. 

Théorème 4.3. [Sorin, 1986] Folk théorème escompté 

Supposons qu’il y ait 2 joueurs, ou qu’il existe u = ( u l )i£N dans E tel que pour tout 

i, u 1 > v l . Alors E\ > E. 

à — 

On peut aussi définir les équilibres sous-jeux parfaits de G\ comme des stratégies 
en équilibre de Nash dans tout sous-jeu de G\. Notons E x l’ensemble (compact) des 
paiements de tels équilibres. 

Théorème 4.4 (Fudenberg Maskin, 1986, 1991). Folk théorème parfait es- 
compté 

Si E a un intérieur non vide , alors E[ > E. 

A à— > o 

On ne démontre pas ici ces deux derniers théorèmes. Indiquons juste que les preuves 
utilisent des punitions “strictes”, et dans le cas sous- jeux parfait on utilise aussi des 
phases de récompense pour, le cas échéant, inciter les joueurs à punir. Un exemple où 
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on n’a pas la convergence de E' x vers E est le jeu à deux joueurs : 

( ( 1 , 0 ) ( 1 , 1 ) \ 

\ (0,0) (0,0) )’ 

Dans tout équilibre sous- jeux parfait escompté, le joueur 1 doit choisir la ligne du haut 
à à chaque étape quoiqu’il se soit passé auparavant, et donc E x = {(1, 1)} pour tout A. 

Donnons maintenant un exemple économique d’équilibre sous-jeux parfait es- 
compté. Considérons un oligopole composé de n firmes identiques, produisant un seul 
bien avec un coût de production marginal constant c > 0. Chacune des entreprises 
doit choisir son prix de vente, et les consommateurs achètent uniquement à l’entre- 
prise meilleur marché (ou en cas d’égalité, à parts égales aux entreprises les moins 
chères). On note D(p) le nombre de consommateurs prêts à acheter une unité du bien 
au prix p, et on suppose la demande toujours satisfaite. Chaque entreprise cherche à 
maximiser son profit, qui vaut 7r (p) = D(p)(p - c ) si l’entreprise propose seule le plus 
bas prix p, et qui vaut zéro si l’entreprise ne vend rien. Supposons que n admette un 
maximum en un prix p > c. 

Si on joue le jeu une fois, le seul prix d’équilibre sera égal au coût marginal c, 
les profits étant nuis. Afin de tenir compte des possibilités dynamiques d’ajustement 
des prix, considérons le jeu répété avec un taux d’escompte À. Examinons le profil de 
stratégies où tout le monde joue p jusqu’au cas éventuel où quelqu’un dévie, et alors 
à partir de ce moment chacun joue le prix c. Le paiement d’une entreprise si tout le 
monde joue selon ce profil est 7r(p)/n, et une entreprise qui dévie de cette stratégie en 
jouant p à une certaine date, aura au plus à partir de là : A7r(p) + (1 — A)0 = A7r(p). 
Donc si les joueurs sont suffisamment patients au sens où A < 1/n, on aura un ES JP 
où le prix observé est le prix de collusion (ou de monopole) p. 

4.3. Les Folk théorèmes Animent répétés. 

Concluons cette partie avec les équilibres des jeux Animent répétés. Dans le dilemme 
du prisonnier, on montre par récurrence que pour tout T, Et se réduit à {(1,1)}. 
Donc le “bon” paiement (3, 3) ne peut être approché par des équilibres du jeu Ani- 
ment répété, et on n’a pas la convergence de Et vers E. 

Là encore, on définit les ESJP de Gt comme des profils de stratégies a en équi- 
libre de Nash dans tout sous-jeu : G {0, ..., T — 1}, V/i G H t , a[h] est un équilibre de 

Nash du jeu restant, i.e. de GT-t • On note E' T l’ensemble (compact) des paiements 
d’ESJP de Gt . Citons deux derniers Folk théorèmes, dont les preuves utilisent là 
encore judicieusement plan principal, phases de punitions et phases de récompense. 
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Les convergences sont au sens de Hausdorff. 

Théorème 4.5 (Benoît et Krishna, 1987). Folk théorème Uniment répété 
Supposons que pour chaque joueur i il existe x dans E\ tel que x % > v % . 

Alors Et ^ E. 

T— »oo 

Théorème 4.6 (Benoît et Krishna 1985, Gossner 1995). Folk théorème parfait 
Animent répété 

Supposons que pour chaque joueur i , il existe x et y dans E\ tel que x l > y 1 et que E 
est d y intérieur non vide. Alors Eip > E. 

1 T— »oo 

5. Extensions : exemples 

On va dépasser ici le modèle standard de jeu répété non stochastique à informa- 
tion complète et à observation parfaite, en présentant quelques idées sur des exemples 
et sans développer les techniques. 


5.1. Un exemple de jeu répété avec signaux. 

Dans les jeux répétés avec signaux, les joueurs n’observent pas après chaque étape le 
profil d’actions venant d’être joué, mais reçoivent des signaux dépendant de ce profil. 

Considérons un exemple où avec deux joueurs où les ensembles de signaux sont 
donnés par U 1 = {u,v,w} et U 2 = {*}. Après chaque étape, le joueur 1 reçoit donc 
un signal dans {u,u,u;}, alors que le joueur 2 reçoit le signal *. Celui-ci peut donc 
être considéré comme un joueur “aveugle”, qui se rappelle juste des actions qu’il a lui- 
même jouées. Les paiements des joueurs dans le jeu de base et les signaux du joueur 
1 sont donnés par : 

G D 

H ( (0,0), u (4/5,1),* \ 

B ( (l/5,0),w (1,0), w J 

(4/5, 1) est un paiement réalisable et IR. Cependant, on peut montrer qu’à l’équilibre 
les joueurs ne peuvent jouer un nombre significatif de fois la case (H, D) : si c’était le 
cas, le joueur 1 pourrait dévier de façon profitable en jouant B sans jamais craindre 
de punition de son adversaire. 

Formellement, on prouve ici que Eqq = conv {(1/5, 0), (1, 0)}, et donc Eqq est stric- 
tement inclus dans l’ensemble des paiements réalisables et individuellement rationnels. 

On ne sait pas en général caractériser Eqq dans les jeux répétés avec signaux, 
même pour deux joueurs. Parmi les nombreux articles sur le sujet, citons notamment 
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Lehrer (1989, 1992), ainsi que Renault et Tomala (1998, 2004) et Gossner et Tomala 
(2007). 


5.2. Un exemple de jeu stochastique. 

L’aspect jeu stochastique n’apparaît que lorsqu’il y a plusieurs jeux de base possibles, 
et donc plusieurs états. A chaque étape on joue celui des jeux de base qui corres- 
pond à l’état courant : les actions jouées déterminent alors les paiements mais aussi 
la probabilité de transition vers l’état suivant. 

L’exemple suivant est un jeu à deux joueurs et somme nulle appelé “Big Match" 
et du à Blackwell et Ferguson (1968). Il est représenté par la matrice suivante. 

G D 

H { 1* 0* \ 

5 V o 1 J 

Les joueurs commencent à l’étape 1 par jouer la matrice ci-dessus. Ils continuent 
ainsi tant que le joueur 1 joue B (et le joueur 1 observe après chaque étape l’action 
jouée par le joueur 2). Par contre, si un jour le joueur 1 joue H alors le jeu s’arrête, 
et de deux choses l’une : soit le joueur 2 a joué G ce jour-là, et alors le joueur 1 reçoit 
le paiement 1 à chaque étape ultérieure, sinon le joueur 2 a joué D ce jour-là et alors 
le joueur 1 a un paiement nul à chaque étape ultérieure. 

Formellement, il y a trois états ici : l’état de départ, l’état où le joueur 1 reçoit 
le paiement de 1 quoiqu’il arrive, et l’état où le joueur 1 a un paiement nul quoiqu’il 
arrive. Ces deux derniers états sont absorbants, c’est-à-dire que l’on y reste pour tou- 
jours à partir du moment où on y est entré (ils sont représentés par des * dans la 
matrice de départ.) 

Le joueur 2 peut jouer à chaque étape l’action mixte 1/2 G + 1/2 D, et il est 
facile de montrer que le joueur 2 garantit ainsi le paiement 1/2. On a même 

3a 2 , VT, Ver 1 , 7 ^(cr 1 ,^ 2 ) < 1/2. 

Il est ici plus difficile et très intéressant d’imaginer des bonnes stratégies pour le joueur 
1. 

Théorème 5.1 (Blackwell et Ferguson, 1968). 

Le Big Match a une valeur uniforme et cette valeur vaut 1/2 , ce qui signifie : 
le joueur 1 garantit 1/2 , i.e. Ve > 0, 3a 1 , 3To, VT > To, Ver 2 , 7^(cr 1 ,cr 2 ) > 1/2 — e, 
et le joueur 2 garantit 1/2 , i.e. Ve > 0, 3a 2 , 3To, VT > To, Ver 1 , 7 ^(cr 1 ,^ 2 ) < 1/2+e. 

Les jeux stochastiques ont été introduits par Shapley (1953). Mertens et Neyman 
(1981) ont montré en 1981 l’existence de la valeur uniforme dans tout jeu stochastique 
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(à information complète, sans signaux). Plus récemment, N. Vieille (2000a et 200b) a 
prouvé l’existence de paiements d’équilibres dans les jeux stochastiques à somme non 
nulle et 2 joueurs, la question restant ouverte pour un plus grand nombre de joueurs. 
Concernant les jeux stochastiques à somme non nulle, on peut notamment citer éga- 
lement Sorin (1986b), Solan (1999) et Solan et Vieille (2001). Pour des surveys, voir 
Mertens (2002), Vieille (2002). 

5.3. Des exemples de jeux répétés à information incomplète. 

Dans un jeu répété à information incomplète, il y a également plusieurs états pos- 
sibles, et à chacun de ces états correspond un certain jeu de base. Un des états est 
tiré aléatoirement une fois pour toutes au début du jeu, et à chaque étape les joueurs 
vont jouer le même jeu de base correspondant à cet état. Les connaissances qu’ont les 
joueurs sur l’état sont typiquement imparfaites : chaque joueur reçoit au début du jeu 
un unique signal dépendant de l’état sélectionné, et peut donc avoir une connaissance 
partielle de l’état ainsi que des connaisances des autres sur l’état. 

Plaçons-nous ici uniquement dans le cas de deux joueurs, somme nulle, et 
intéressons-nous à la notion de valeur uniforme, comme dans la sous-section précé- 
dente. On va supposer aussi qu’il y a manque d’information d’un seul côté : le joueur 

1 a toute l’information, il observe parfaitement l’état sélectionné, alors que le joueur 

2 n’est pas informé et ne reçoit initialement aucun signal. Supposons enfin qu’il n’y 
a que deux états, qui sont a priori équiprobables. On a donc le scénario suivant : 
initialement, un état k € {a, 6} est tiré selon p = (1/2, 1/2), et annoncé au joueur 1 
seulement. Le joueur 2 sait que k a été tiré selon p, mais ne sait rien d’autre sur k. 
Puis les joueurs répètent le jeu G k indéfiniment, en observant après chaque étape les 
actions choisies. Les matrices G a et G b sont parfaitement connues des deux joueurs. 

On va voir sur des exemples que le jeu infiniment répété a une valeur uniforme 
(notée Uqo), et que les joueurs ont des stratégies optimales, c’est-à-dire que le joueur 
1 peut jouer une stratégie qui lui garantit Uqo • 

3a 1 , Ve > 0, 3T 0 , VT > T 0 , Va 2 , ^(a\a 2 ) >Voo-e, 

et que de même le joueur 2 peut jouer une stratégie qui lui garantit : 

3a 2 , Ve > 0, 3 T 0 , VT > T 0 , Va 1 , 77 W) < Voo + £• 

Ceci est équivalent à l’existence d’un équilibre uniforme, et implique que la valeur vt 
du jeu en T étapes converge vers Uqo lorsque T tend vers +oo. 

Exemple 1 . G a = ^ ^ ^ ^ et G b = ^ ^ ^ ^ . 

Facile. Le joueur 1 n’a qu’à jouer, à chaque étape, l’action if (haut) si l’état est 
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a et l’action B (bas) si l’état est b. Ainsi la valeur uniforme existe et est nulle : Vqq = 0. 


Exemple 2. G a = 



et G b 



Une stratégie “naïve” du joueur 1 est de jouer à l’étape 1 l’action H si l’état est 
a, et l’action B si l’état est b. Cette stratégie est dite complètement révélatrice , car en 
fonction de l’action jouée par le joueur 1 il est possible de déduire l’état sélectionné. 
Elle est optimale ici dans le jeu à une étape, et la valeur de ce jeu est v\ = 1/2. Mais 
elle est très mauvaise quand le jeu est répété, et ne garantit rien de plus que 0 dans 
le jeu infini. 

A l’inverse, le joueur 1 peut toujours ne pas tenir compte de son information, et 
jouer une stratégie non révélatrice , i.e. jouer indépendamment de l’état. Il considère 

alors la matrice moyenne \G a + \G b = ^ ^ peut jouer à chaque étape 

la stratégie optimale de cette matrice. Puisque la valeur de cette matrice vaut 1/4, 
on a : vt> \ pour tout T. 

Dans le jeu infini, on peut montrer qu’il est ici optimal pour le joueur 1 de jouer 
non révélateur. La valeur uniforme existe et vaut 1/4. 


x. , / 4 0 2 \ . / 0 4 — 2 

Exemple 3. G a = I et G b = I 

4 0 -2 J y 0 4 2 

Jouer une stratégie complètement révélatrice ne garantit que 0 pour le joueur 1, 
car le joueur 2 pourra finalement jouer l’action M(ilieu) si l’état est a, et l’action 
G(auche) si l’état est b. Mais jouer une stratégie non révélatrice revient à se placer 

, et donc ne garantit que 0 également. 

Dans le jeu infini, on montre qu’il est ici optimal pour le joueur 1 de jouer la 
stratégie a suivante. 

Le joueur 1 choisit aléatoirement, une fois pour toutes, un élément s dans {if, B} 
de la façon suivante : si k = a, alors s = H avec probabilité 3/4, et donc s = B 
avec probabilité 1/4; et si k = 6, alors s = H avec probabilité 1/4, et s = B avec 
probabilité 3/4. Ensuite le joueur 1 joue l’action s à chaque étape, indépendamment 
des coups du joueur 2. 

Les probabilités conditionnelles vérifient : P(k = a\s = H) = 3/4, et P{k = a\s = 
B) = 1/4. Donc à la fin de l’étape 1, le joueur 2 ayant observé le premier coup du 
joueur 1 aura appris quelque chose sur l’état de la nature : sa croyance sera passée de 
\a+ \b à fa + \b ou à \a + \b. Mais il ne connaît toujours pas l’état avec probabilité 


dans le jeu \G a + \G b = 
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1 : on parle de révélation partielle d’information. 

On peut prouver qu’ici v qq = 1 (voir la figure suivante). 



(u est en noir et cavu en gris. La figure correspond à l’exemple 3 : cavu(l/2) = 
1/2 16(1/4) + 1/2 u{ 3/4) = 1.) 

Cas général. 

De façon générale, on a le résultat suivant dû à Aumann et Maschler (1966, voir la 
réédition de 1995) et valable pour un ensemble fini quelconque d’états K. Contentons- 
nous de l’énoncer ici. 

Théorème 5.2. 

Dans un jeu répété à somme nulle et manque d’information d’un seul côté où la pro- 
babilité initiale estp, la valeur uniforme existe et vaut ca vu(p), où : 
u est l’application de A (K) dans JR. donnée par u(q) = val(^ fc g /e G /c ) pour toute pro- 
babilité initale q, (valeur du jeu où pesonne n’est informé), et ca vu est la plus petite 
fonction concave supérieure à u. 

Le résultat d’ Aumann et Maschler a ouvert une vaste ligne de recherche, et on 
peut par exemple citer : pour les jeux à somme nulle, Mertens et Zamir (1971, 1977), 
Sorin et Zamir (1985), de Meyer (1996a et 1996b), Laraki (2001, 2002), Renault 
(2006, 2012), et pour les jeux à somme non nulle Sorin (1983), Hart (1985), Simon 
et al. (1995), Renault (2000). Pour des surveys, voir Forges (1992), Zamir (1992) et 
Sorin (2002). 



CHAPITRE 9 


Exercices 


1. Feuille n°l 


Exercice 1 : Mariages stables 

On considère un ensemble H de n hommes (notés a, b ) c) et un ensemble F de 
n femmes (notées A ) B , C, Les hommes ont des préférences strictes sur l’ensemble 
des femmes et les femmes ont des préférences strictes sur l’ensemble des hommes. Par 
exemple avec n = 3, l’homme b peut classser en premier la femme C, puis A puis B ) 
et la femme C peut classer l’homme a puis c puis b. 

Un mariage /x est un sous-ensemble de H x F de cardinal n tel que tout homme est 
associé à exactement une femme, et toute femme à exactement un homme (donc une 
bijection de H sur F). 

Un mariage /x est stable s’il n’existe pas de couple alternatif (æ, Y) non marié suivant 
[i et tel que chacun préfère son partenaire dans le couple alternatif à celui qu’il a avec 
/x. 

Ce modèle a été introduit par Gale et Shapley (1962) qui ont montré l’existence 
d’un mariage stable grâce à l’algorithme suivant : 

Les femmes restent chez elles et les hommes se déplacent (on obtient un autre algo- 
rithme en supposant que ce sont les femmes qui se déplacent). 

Jour 1 : chaque homme propose la femme qu’il préfère; si une femme a plus 
d’une proposition, elle garde l’homme qu’elle préfère et rejette tous les autres. Si 
chaque femme a exactement une proposition l’algorithme s’arrête. Sinon : 

Jour 2 : chaque homme rejeté le premier jour propose la femme suivante sur sa 
liste de préférences puis chaque femme compare les nouvelles propositions à l’ancienne 
qu’elle a déjà gardée (si elle en a) puis décide de conserver celle qu’elle préfère et re- 
jette les autres. Si chaque femme a exactement une proposition l’algorithme s’arrête. 
Sinon, par induction : 

Jour k : chaque homme rejeté le jour précédent propose la femme suivante sur 
sa liste. Chaque femme compare les nouvelles propositions à l’ancienne (si elle en a) 
puis décide de garder celle qu’elle préfère et rejette les autres. Si chaque femme a 


ni 
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exactement un homme l’algorithme s’arrête. Sinon on continue... 

1) Montrer que l’algorithme est bien défini et qu’il s’arrête nécessairement en un 
nombre de jours inférieur à n 2 . 

2) Trouver tous les mariages stables des tableaux de préférences suivants : 


A 

( 1 , 3 ) 

( 3 . 1 ) 

( 2 . 2 ) 


B 

( 2 , 2 ) 

( 1 , 3 ) 

( 3 , 1 ) 


C 

( 3 . 1 ) 

( 2 . 2 ) 

( 1 , 3 ) 


et 


A 

(1.3) 

( 1 . 4 ) 
( 2 , 2 ) 
( 4 , 1 ) 


B 

c 

D 

(2,3) 

(3,2) 

( 4 , 3 ) 

( 4 , 1 ) 

( 3 , 3 ) 

(2,2) 

( 1 , 4 ) 

( 3 , 4 ) 

( 4 , 1 ) 

(2,2) 

( 3 , 1 ) 

( 1 , 4 ) 

classe la femme 

A en première 


position et que la femme A classe l’homme a en troisième position. 


3) Montrer que le résultat de l’algorithme est toujours un mariage stable. 

4) Montrer qu’il n’existe pas toujours de mariage stable dans une communauté : 
2 n étudiants ont chacun des préférences sur les 2n — 1 autres et souhaitent cohabiter 


dans des chambres de deux personnes. 

5) Définir un mariage stable et étudier son existence dans une société polygame : 
soient n polytechniciens et m écoles d’application ; chaque étudiant a des préférences 
sur les écoles et chaque école a une préférence sur les étudiants et un quota d’étudiants 


à ne pas dépasser. 


Exercice 2 : Procédure de partage 

Un arbitre se propose de couper un gâteau (égal au carré [0, 1] x [0, 1]) entre deux 
joueurs de la manière suivante. Il déplace son couteau de façon continue de gauche à 
droite (de 0 vers 1) sur l’axe des x. Le premier joueur qui arrête le jeu à a; G [0, 1] 
gagne la part se trouvant à gauche de x et l’autre gagne la part se trouvant à droite 
de x. Si les deux joueurs arrêtent en même temps c’est le joueur 1 qui gagne la part à 
gauche de x. La valeur totale du gâteau pour chaque joueur est égale à 1. La valeur 
de la part à gauche de x pour le joueur 1 est f(x) et sa valeur pour le joueur 2 est 
g(x) où /(•) et g(-) sont deux fonctions continues et strictement croissantes dont le 
graphe va de (0,0) à (1,1). 

1) Montrer que chaque joueur peut se garantir au moins 1/2. 

2) Si vous êtes le joueur 1 (resp. 2) et que vous connaissez l’utilité de l’autre 
joueur, que faites vous ? 

3) Si vous êtes le joueur 1 (resp. 2) et que vous ne connaissez pas l’utilité de 
l’autre joueur, que faites vous? (il n’y a pas de réponse “juste”). 

4) L’arbitre change les règles du jeu et décide de parcourir l’axe des x de droite 
à gauche. Les joueurs sont-ils indifférents à ce changement ? 
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Exercice 3 : Bus ou voiture ? 

Soit une population d’une ville avec un très grand nombre d’individus que l’on 
représente par l’intervalle [0, 1]. Les individus ont le choix entre le bus et la voiture et 
ont les mêmes préférences : u(Æ, x) (resp. u(V \ x)) est l’utilité d’un usager qui prend le 
bus (resp. la voiture) dans un environnement où x est la proportion des personnes qui 
prennent le bus. Il est naturel de supposer que l’utilité de prendre la voiture u(y,x) 
est continue et strictement croissante avec x (plus x est grand, moins il y a de traffic 
et plus il y a de places de stationnement). u(B,x) peut être une fonction continue 
quelconque. 

On part d’une distribution initiale Xo G]0, 1[ et on suppose que x t) la distribution 
de la société à l’instant t G [0, +oo[, évolue suivant la dynamique du réplicateur : 

x t = [u(B, x t ) - v(x t )]x t . 

avec v(x t ) = x t u(B,x t ) + (1 - x t )u(V,x t ). 

Etudions les points stationnaires de cette dynamique en fonction des préférences. 

1) Que se passe-t-il si u(V,x) > u(B,x) Vx? 

2) Construire un exemple numérique où 1’ “utilité sociale”, v(x t ) ) diminue stricte- 
ment avec le temps. 

3) Que se passe-t-il si u(V , x) = 2 + 3x et u(B , x) = 3 ? 

4) Supposer que u(B, 0) > U(V, 0) et que u(B, 1) < £/(V, 1). Montrer que généri- 
quement, le nombre de points stationnaires de la dynamique (limites de trajectoires 
partant dans ]0, 1[) est impair (égal à 2m + 1), et que parmi eux m + 1 sont des 
attracteurs locaux. 

5) Faire de même dans les autres cas de figures (toujours dans un cadre générique). 

Exercice 4 : Enchère à la Vickrey 

Un tableau est vendu aux enchères suivant la procédure suivante : 

a) chaque joueur j soumet sous enveloppe une offre pj ; 

b) le joueur k qui soumet la plus grande offre (p/ c = max^pj) gagne l’objet ; 

c) s’il y a plusieurs joueurs A;, le gagnant est sélectionné entre eux au hasard suivant 
une distribution uniforme ; 

d) le gagnant paie pour le tableau le second meilleur prix p offert (soit p = ma x^^pj). 

Supposons que chaque joueur i possède une utilité égale à 0 s’il ne gagne pas 
l’objet et égale à Vi — p s’il gagne l’objet et l’achète au prix p (où Vi est interprété 
comme étant le prix maximal auquel le joueur i est prêt à acheter l’objet). 

Montrer que proposer p* = Vi est une stratégie dominante pour chaque i. 



114 


Chapitre 9. Exercices 


2. Feuille n°2 


Exercice 1. Théorème de Loomis (1946) 

Soient A et B deux matrices I x J, avec B 0 (tous les coefficients de B sont 
strictement positifs). On va montrer qu’il existe un unique v G M, et des éléments 
s G A (/), t G A (J) tels que : 

sA > v sB ) et At < v Bt. 

On n’utilisera pas ici le théorème de Von Neumann. La preuve est par récurrence 
sur \I\ + |J|. 

1) Soient A et B dans M /Xj , où \I\ + \ J\ > 3. On définit Ào = sup{A G M, 3s G 

A (J), s A > À s£}, et /x 0 = inf{/i G M, G A( J), At < fi Bt}. 

1.1) Montrer que le sup et l’inf sont atteints, et que Ào < fxo- Si Ào = /xo, le résul- 
tat est démontré, on suppose donc dans la suite Ào < fxo- Soient so et to tels que 
5 oA > Ào soB , et Ato < /xo Bto. 

1.2) Montrer qu’on ne peut avoir soA - Ào SoB = 0 et Ato ~ HoBto = 0. 

1.3) On suppose ici qu’il existe J' ^ J tel que : Vj G J, ( sqAj — Ào soBj = 0 ssi j G J'). 

En utilisant l’hypothèse de récurrence, on définit v' G /Æ et s' G A (J) associés aux 
sous-matrices I x J' de A et de B. Montrer que v' > /j>o > Ào, et obtenir une contra^ 
diction dans la définition de Ào- 

1.4) Conclure. 

2) Déduire le théorème du minmax de Von Neumann du théorème de Loomis. 

3) Soit B une matrice carrée > 0. Montrer qu’il existe un vecteur propre de 
B associé à une valeur propre strictement positive et qui a toutes ses coordonnées 
strictement positives. (Perron- Frobenius). 


Exercice 2. Minmax à 3 joueurs 

On considère le jeu à 3 joueurs où le joueur 1 choisit une probabilité x G 
A ({if, B }), le joueur 2 choisit y G A({G, D}) et le joueur 3 choisit 2 G A({0, E}). Les 
probabilités employées par les joueurs sont indépendantes, et le paiement du joueur 
3 est donné par l’espérance de la fonction g suivante : 


G D G D 


H 

1 

0 

H 

0 

0 

B 

~ô~ 

0 

B 

0 

1 


O E 
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Comparer 

maxmin g(x ) y ) z) et min ma xg(x,y,z). 

(x,y) z z (x,y) 

Exercice 3. Théorème de Ville (1938) 

Soient X = Y = [0, 1] munis de leur tribu Borélienne, et / une application conti- 
nue de X x Y dans M. On considère le jeu à somme nulle G où le joueur 1 choisit a 
dans A(X), le joueur 2 choisit r dans A (V), et le paiement du joueur 1 est : 

/(<*, r) = [ f(x,y) dcr{x) dr(y). 

JXxY 

Pour chaque n > 1, on définit le jeu matriciel G n où : le joueur 1 choisit une 
action dans X n = i G {0, ..., 2 n }}, le joueur 2 choisit une action dans Y n = X n , le 
paiement du joueur 1 étant donné par G n (z, j) = /(^, ^ r ). On note v n la valeur (en 
stratégies mixtes) de G n . 

1) Montrer que dans G le joueur 1 garantit limsup n u n (à e près pour tout e > 0). 
En déduire que G a une valeur. 

2) Montrer que dans G chaque joueur a une stratégie optimale. (On pourra plonger 
les stratégies optimales de {G n } dans A([0, 1]) et en extraire une sous suite faiblement 
convergente). 

Exercice 4. Approchabilité déterministe et théorème de minmax 

Soient C un convexe fermé de H K (muni de la norme Euclidienne) et {x n } une 
suite bornée de H K . 

Pour tout x dans R K , ITc(æ) dénote la projection de x sur C et x n dénote la 

moyenne de Césaro à l’étape n de la suite {x n } : 

_ 1 ^ — \ n 
%n — / . 

n 

1) Approchabilité de Blackwell en déterministe (Blackwell, 1956) : 

Montrer que si {x n } est une C-suite de Blackwell, i.e. satisfait 

(x n+ i - U C {x n ),X n - n c (Æn)> < 0, Vn 

alors d n = d(x n , C) converge vers 0. 

2) Conséquence : le théorème du minmax. 

Soit A une matrice I x J représentant les paiements d’un jeu à deux joueurs à somme 
nulle. Supposons que le joueur 2 ne peut pas garantir moins que 0 : 

v = min m&xiAt = 0 
teA(i) iei 

et montrons que le joueur 1 peut alors garantir 0, i. e. v > 0. 
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Pour cela définissons une suite x n G R J par récurrence. Le premier terme x\ est une 
ligne quelconque de la matrice A. Etant donnés X\, x<i , ..., x n nous définissons x n +i 
comme suit : 

Soit x+ le vecteur dont la j-è me coordonnée est max(x£,0). Si x n = x+ alors x n +i 
est une ligne quelconque de la matrice. Sinon, soit a > 0 tel que 

Wi = e A (J), 

a 

Puisque v = 0, il existe i n . j_i G I tel que i n +\At n +\ > 0. x n +\ est alors la ligne z n +i 
de la matrice A. 

2.1) Montrer que {x n } est C-une suite de Blackwell avec C = {x G R J ; x > 0}. 

2.2) Conclure qu’il existe s G A (/) satisfaisant sAt > 0, pour tout t G A (J). 


Exercice 5. Calcul de valeurs 

Calculer la valeur et les stratégies optimales des jeux à somme nulle suivants (où 
x G JR) : 


ai 

0>2 

^3 


b 1 


1 

2 

0 



b\ &2 


00 

-1 

0 

0 

-2 

1 


Exercice 6. Un jeu diagonal 

Calculer la valeur et les stratégies optimales de la matrice diagonale n x n avec 
üi> 0 pour tout i : 

ai 0 0 \ 

0 a2 ... 0 

V 0 0 ... a n J 
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3. Feuille n°3 


Exercice 1 : Duels 

On suit Dresher (1961). 

Deux joueurs à une distance initiale Do, avancent l’un vers l’autre avec chacun un pis- 
tolet chargé d’une ou plusieurs balles. La distance entre les deux à l’instant t G [0, 1], 
Du diminue strictement avec le temps jusqu’à atteindre 0 quand t = 1. 

On supposera que le gain d’un joueur est égal à +1 s’il est le seul survivant, — 1 
s’il meurt seul et 0 sinon. On supposera aussi que la probabilité que le joueur i = 1,2 
tue son adversaire en tirant une balle à l’instant t est Pi(t) où Pi(t) est une fonction 
continue et strictement croissante avec pi( 0) =0 et Pi{l) = 1. 

Ces deux fonctions sont connues des deux joueurs. La fonction de paiement de ce 
jeu à somme-nulle est l’espérance du gain du joueur 1 (qui maximise). 

1) Les joueurs disposent chacun d’un pistolet bruyant et d’une seule balle. Ainsi, si 
l’un des deux a tiré, l’autre l’a entendu. Après le premier tir, le comportement optimal 
du survivant est donc d’avancer jusqu’à une distance nulle et de tuer l’adversaire. 

Une stratégie pure du joueur 1 (resp. 2) est l’instant x G [0, 1] (resp. y) où il va 
tirer s’il est encore en vie et si l’autre n’a pas encore tiré. 

Montrer que le jeu a une valeur en stratégies pures et que la stratégie optimale 
du joueur i est de tirer à l’instant to où Pi(to) +pj(to) = 1. 

2) Les joueurs disposent de plusieurs balles (m pour le joueur 1 et n pour le joueur 
2) et de pistolets bruyants. On supposera que p\(t) = p 2 (t) = t. 

fi 

Montrer par récurrence sur m + n que la valeur du jeu est — et qu’il est 

optimal pour le joueur qui a un nombre de balles égale au ma x(m, n) de tirer pour la 

première fois à to = • 

m + n 

3) Les joueurs disposent d’une balle chacun et de pistolets silencieux (de sorte 
qu’aucun des deux ne sait si l’adversaire a déjà tiré ou pas). On supposera pi(t) = 
p 2 (t) = t. 

Maintenant une stratégie pure du joueur 1 (resp. 2) est le moment où il va tirer 
s’il est encore en vie et sera encore noté x G [0, 1] (resp. y). 

3.1) Montrer que le jeu n’a pas de valeur en stratégies pures. 

3.2) Le joueur 1 décide de tirer suivant une stratégie mixte de support [a, 1] et une 
densité f(x)dx. Montrer qu’il existe une fonction / différentiable et a > 0 qui lui 
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garantissent un paiement positif ou nul. Conclure. 


4) Le joueur 1 a un pistolet silencieux et une balle, l’autre un pistolet bruyant 
et une balle aussi. On suppose Pi(t) = p 2 (t) = t. On veut montrer que le jeu a une 
valeur en stratégies mixtes v = 1 — 2 a avec a = y/2 — 1. 

4.1) Montrer que la stratégie mixte de densité : 


/(*) = 


0 

y/2 a 

0 x 2 + 2x - 1) 3/2 


si 0 < x < a 
si a < x < 1 


assure 1 — 2a au joueur 1 . 

4.2) Montrer que le joueur 2 s’assure le même paiement en mixant suivant la fonction 
de répartition suivante : 


G (y) = [ f( x ) dx + (y). 

2 + a J 0 Z + a 

où h(y) est la fonction de répartition associé à la masse de Dirac au point 1. Ainsi, 
le joueur 2 utilise la même stratégie que le joueur 1 avec probabilité et décide de 
tirer à l’instant 1 avec probabilité 


5) Peux t-on raisonner par récurrence dans le cas d’un duel silencieux avec plu- 
sieurs balles. 


Exercice 2 : Un contre-exemple (Sion, 1958) 

Soit S = T = [0, 1] et / l’application de S x T — > {0, — 1} définie comme suit : 

{ —1 si t = 0 s < \ 

-1 si t = 1 s > ^ 

0 sinon. 

Montrer que le jeu n’a pas de valeur en stratégies pures et que les conditions de Sion 
sont satisfaites partout sauf en t = 1. 

Ce jeu admet-il une valeur en stratégies mixtes ? 

Exercice 3 : Famille monotone 

On considère une famille de jeux à somme nulle G n = (5, T, f n ) telle que : 

- (fn) est une suite décroissante de fonctions uniformément bornées, s.c.s en s pour 
chaque t, 

- pour tout n, G n a une valeur v n , 

- S est compact. 
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1) On pose / = inf n / n . Montrer que G = (5, T,/) a une valeur v = inf n v ni et 
que dans G le joueur 1 a une stratégie optimale. 

2) Comparer la valeur v de G et lim v n dans les deux cas suivants d’un jeu à à un 
seul joueur : 

(i) S = [0, +Oo[, fn( s ) = l{s>n} 

(U) S = [0, 1], f n est continue et linéaire par morceaux (trois morceaux) : / n ( 0) = 

/»(£) = /"C 1 ) = 0 et /»(£) = 1- 

Exercice 4 : Inégalités dans les jeux à somme nulle 

Soit (A, B, g) un jeu à somme nulle où A est l’ensemble des stratégies pures du 
joueur 1 et B est l’ensemble des stratégies pures du joueurs 2 et g : A x B — > R est 
la fonction de paiement (du joueur 1). Soit A l’ensemble des fonctions de réaction 
a : B — > A du joueur 1 et S l’ensemble des fonctions de réaction P : A — > B du joueur 
2. Rappelons que v = sup aGi4 inffc G £ g(a , b) et que v = inf sup aGA g(a , b). 

1) Montrer que v = inf^gsup a eA9( a i P( a )) et que v = sup aG ^infb Gj B <?(a(6), b). 

Supposons désormais que A et B sont des convexes compacts de R*\ Soient A c le 
sous-ensemble des fonctions a dans A qui sont continues et B c le sous-ensemble des 
fonctions j3 G B qui sont continues. 

2) Montrer queu < sup aG ^ ( inf beB di^ib)^) et que inf/ 3 G £ (; sup aG>l #(a, (3(a)) <v. 

3) Montrer que pour tout a G A c et P G B c il existe (a, b) G A x B tel que a(b) = a 
et que P (a) = b. 

4) En déduire que 

sup infa(a(6), b) < inf sup^(a,^(a)) 
aeAc.te B P€B<:a€A 

5) Calculer v, t7, sup aG>Ac inf 6GB ^(a(6), 6) et inf p eBa sup aeA g(a, /3(a)) quand 
A = B = [ 0,1] et g(a , b) = \a — b\. 
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4. Feuille n°4 


Exercice 1 : Approchabilité de Blackwell 

Soit A une matrice I x J à valeurs dans RA Aij G H k est le résultat (vectoriel) 
si le joueur 1 joue i et le joueur 2 joue j. Pour x G A (J), xA dénote l’ensemble dans 
H k des résultats compatibles en espérance quand le joueur 1 joue x : 

xA = {g G H k : 3 y G A (J) tel que g = xAy} 

= {^. 6/ .çjXiAijVjiy 6 A(J)} = conv G J}. 

Soit C un convexe fermé non vide de R fc (muni de la norme Euclidienne). Pour tout 
2 dans R fc , IIc^) dénote le point de C le plus proche de i.e. la projection de z sur 
C. 

On suppose que l’ensemble C est un B-ensemble pour le joueur 1, i.e. satisfait : 

Wz fi C, 3x G A (/) tel que V# G xA : (g - Uc(z ), 2 — ïïc(z)) < 0. 

Cela signifie que l’hyperplan affine passant par II c(z) et orthogonal à [z,Uc(z)\ sé- 
pare z de xA. 

Le jeu se joue en temps discret durant un nombre infini d’étapes. Nous le définissons 
inductivement. A chaque étape n, n = 1,2,..., après avoir observé l’histoire h n - 1 des 

actions choisies dans le passé jusqu’à l’étape n— 1, soit h n -\ = (ii, Ji, ,i n -uj n -i) G 

Un- 1 , avec Ti n = (/ x J) n et T-Lq = {0}, le joueur 1 choisit x n (h n - 1 ) G A (/) et le 
joueur 2 choisit y n (h n - 1 ) G A (J). Un couple (i n , j n ) G / x J est alors tiré selon la 
distribution de probabilité produit x n (/i n _i) (g) 2/ n (^n-i)- On passe à l’étape n + 1 

avec l’histoire h n = (iuju , jn) £ 'Hn- Ainsi, une stratégie a du joueur dans 

le jeu répété est de la forme a = (x\, ...,æ n , ...) où x n : Un - 1 — ► A(J). Une stra- 
tégie r du joueur 2 est de la forme r = (j/i, ..., y n > ...) où y n : H n -i — >• A(J). Un 
couple (cr,r) définit une distribution de probabilité P a r sur l’ensemble des parties 
'Hoo= (/ x J) , muni de la tribu cylindrique, et on note l’espérance associée. 
Chaque partie du jeu (ii,ji, ...,i n » Jn» •••) génère une suite de paiements vectoriels 
(</i = Ai u j v . . . , g n = Ai iit j i0 ...) dans R fc . Soit g n sa moyenne de Cesàro à l’étape n : 



Blackwell a montré qu’il existe une stratégie a du joueur 1 telle que g n s’approche 
de l’ensemble C et ce quelque soit la stratégie r du joueur 2 : d n = \\g n — ïlc(9n)\\ ^ 0» 

P ^-presque sûrement. La stratégie de Blackwell a est définie inductivement comme 
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suit. A l’étape n+ 1, si g n G C le joueur 1 joue x n+ \ G A (/) quelconque, sinon il joue 
Æ n+ i G A (I) telle que pour tout y G A (J) : 

(x n+1 Ay - U c (g n ),gn ~ n c (<?n)) < 0. 

(On utilise ici le fait que C est un B-ensemble.) Dans la suite, le joueur 1 utilise la 
stratégie a de Blackwell, et r est une stratégie quelconque du joueur 2. 


1) Montrer que, pour tout n > 1 et h n dans 'Kn * 

E«r,r [4+1 M < ^E ff , T [|| 5n+1 - II C ( 0 n )|| 2 |fc„] + 

2) Montrer que E a , T [||g„+i - nc.(^„)|| 2 |/i n ] < 4 ||i4||^ avec = max i)Jifc ||A^|| . 

3) En déduire que 

Ecr,r [d n ] ^ 


En particulier, la convergence est uniforme en r. 

4) Soit e n = dn + X^ n+1 Montrer que {e n } est une surmartingale positive 

dont l’espérance tend vers zéro. En déduire que [d n — > 0] = 1. 


Exercice 2 . 

Soit S = T = [0, 1]. On considère le jeu G = (S, T, /), où : 
( 0 si s = t 


/(M) = { 


-4 si s>t 


î 

t* 


si s < t 


1) Montrer que pour tout t dans T, / s /(s,£) ds = 1. 

2) En déduire que : sup a€A(iS) inf ter f fat) > inf T€A ( T) sup sG < ? /(s,r), où 
/(<M) = / S /(M) et /(«,'*') = / t /(M) dr(t). 

3) On rappelle que l’on a toujours sup^inf T f < inf T sup a f. Que penser de l’ex- 
tension mixte de G ? 


Exercice 3. Sion et Wolfe (1957) 

Soient S = T = [0, 1] munis de leur tribu Borélienne, et / définie sur S xT par : 
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—1 si s < t < s + 1/2, 

/(s, t) = < 0 si t = s ou t = s + 1/2, 

1 sinon. 

On considère l’extension mixte G où le joueur 1 choisit a dans A (5), le joueur 2 
choisit r dans A (T), et le paiement du joueur 1 est 

f(^ T )=[ /(s, t) dcr(s) dr(t). 

Js,t 

Montrer que sup <r6A(S) inf teT /(o-,t) = 1/3. 

En déduire que G n’a pas de valeur. 
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5. Feuille n°5 


Exercice 1. 

1) Calculer les équilibres de Nash en stratégies mixtes des jeux suivants 
à deux joueurs : 

G D 
H ( (6,6) 

B l (7,2) 


H 

B 



H 

B 


(-3,3) (4,-4) 


G D 
( 1 , 0 ) ( 2 , 1 ) 
( 1 , 1 ) ( 0 , 0 ) 


à trois joueurs : 



9 

m 

d 

H 

(1,1) 

(0,0) 

(8,0) 

M 

(0,0) 

(4,4) 

(0,0) 

B 

(0,8) 

(0,0) 

(6,6) 


G D 

H ( (1,1,-1) (0,0,0) 

B (0,0,0) (0,0,0) 

O 


G D 

( 0 , 0 , 0 ) ( 0 , 0 , 0 ) 
( 0 , 0 , 0 ) ( 1 , 1 ,- 1 ) 

E 


2) Calculer les valeurs des jeux à somme nulle représentés par les matrices sui- 
vantes. 


1 2 
0 3 




3 

1 \ 

1 “I \ 

et 


0 

0 

-2 0 y 


(M 

1 

4 



7 

-2 / 


Exercice 2. 

Un groupe de n pêcheurs exploite un lac. Si chaque pêcheur i prend une quantité 
Xi>0, le prix unitaire du poisson s’établit à p = max(l — Y17=i x ^ 0)- Chaque pê- 
cheur vend toute sa production au prix p et cherche à maximiser son revenu (le coût 
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de production est supposé nul). 

1) Ecrire le jeu sous forme stratégique associé. 

2) Calculer les équilibres de Nash et le revenu total à chaque équilibre. 

3) Etudier le cas du monopole (n = 1) et comparer. 

Exercice 3. Paiements réalisables 

On note j le nombre complexe e 2 ^, et g l’application de C 3 dans C définie par 
g{a , 6, c) = abc. Soit le jeu G à 3 joueurs, où A 1 = {1, j}, A 2 = {j, j 2 }, et A 3 = {j 2 , 1}. 
Pour (a, 6, c) dans A 1 x A 2 x A 3 , le paiement du joueur 1 est la partie réelle de g(a , 6, c), 
celui du joueur 2 la partie imaginaire de g(a , 6, c), et le paiement du joueur 3 est nul. 

1) Déterminer l’extension mixte de G. 

2) L’ensemble des paiements réalisables en stratégies mixtes est-il convexe? 
contractible ? 

Exercice 4. 

A) Théorème de Tarski 

On se place dans l’espace euclidien JR n , muni de l’ordre partiel produit : x > y ssi 
Xi > yi pour tout i. Un sous-ensemble S de R n est un sous-treillis de W 1 si pour tous 
x et y dans S, on a : sup{rc, y} G S et inf {x,y} G S. On considère un sous-treillis 
compact non vide S de R n . 

A.l) Montrer que pour tout sous-ensemble non vide A de 5, on a supA G S et 
inf A G 5 (considérer par exemple une partie dénombrable dense de A). En déduire 
que S a un plus grand et un plus petit élément. 

A.2) Soit / une application croissante de S dans S. Montrer qu’elle a un point fixe. 

B) Jeux supermodulaires 

On considère un jeu stratégique G où pour tout joueur i G N l’ensemble de stratégies 
S 1 est compact non vide de et la fonction de paiement g 1 est s.c.s en s 1 à 
fixée. On suppose de plus le jeu G supermodulaire, c’est-à-dire : 

(i) Pour tout z, S 1 est un sous-treillis de . 

(ii) g 1 a des différences croissantes en ( s l ,s~ l ) : g l {s l ^s~ l ) — g t (s ,t y s~ t ) > 
g\s\ s'-*) - g*(8 H , J-*) si s i > s H et s"* > af~\ 

{in) g 1 est supermodulaire en s 1 : Vs - * G S _ \ g l {s L , s~ z ) + g l (s n , < 
V s'\ + g i (s i A s'\ s ~ i ). 
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B.l) Montrer que pour tout i et BR}{s~ l ) est un sous-treillis compact non 
vide de R m \ 

B. 2) On suppose s~ % > s'~\ Montrer que \/t n e BR}{s '~ *), 3 1 * G BR î (s~ î ) t.q. t % > t H . 
B. 3) Montrer que G possède un équilibre de Nash. 

C) Exemple : duopole de Coumot 

Soient deux entreprises 1 et 2 : chaque entreprise i choisit qi dans [0, Qj\ et a comme 
paiement Qi{q^ Qj) = qiPi(qi + qj) — Gi(qi), où la fonction de demande inverse Pi et 
le coût de production Ci sont de classe C 1 , et le revenu marginal P» + qidPi/dqi est 
décroissant en qj. 

Montrer l’existence d’un équilibre de Nash. 

Exercice 5. Variété des équilibres de Nash 

On considère la famille de jeux à un paramètre a G IR : 


H 
M 
B 

Décrire la variété des équilibres de Nash de jeu en stratégies mixtes en fonction de a 
(Chapitre 5, FIG. 5.1). 

Exercice 6. Jeu de minorité 

On considère le jeu symétrique à 3 joueurs où chaque joueur choisit rouge ou 
blanc, et gagne 1 si il est seul de sa couleur et 0 sinon. 

1) Décrire l’ensemble des équilibres de Nash en stratégies pures. 

2) Décrire l’ensemble des équilibres de Nash en stratégies mixtes. 


G D 


a, 0 

a, 0 

i,-i 

-i,i 

-i,i 

i,-i 
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6. Feuille n°6 

Exercice 1. Théorème de Kakutani via l’existence d’équilibres de Nash à 
2 joueurs (McLennan et Tourki, 2006) 

1) On considère une classe Q de jeux G k 2 joueurs définis par un espace fini 
d’actions I et 2 familles de points (xi)i€i, ( Vi)iei dans R K . Le paiement du joueur 1 
si (z, j) G I x I est joué, est donné par 

/(*.j) = -I N- Vif 

et celui du joueur 2 par 

g(iy j) = Sij ( 1 sii = j, 0 sinon). 

G est donc un jeu bimatriciel et possède un équilibre noté (ct,t). 

Montrer que le support S(r) de r est inclus dans celui de cr, puis que S (a) est 
inclus dans {i G I\x% minimise \\xi — z\\ 2 } où 2 est la combinaison convexe des yj 
induite par r : 

2) Soient C un convexe compact non vide de R K , et F une correspondance s.c.s. 
à valeurs convexes compactes non vides de C dans lui même. 

On définit inductivement les jeux G n = G(x \ , ..., x n \ j/i, ..., ?/ n ) dans C/ comme suit : 
X\ est arbitraire, y\ G F(x i) ; étant donné un équilibre (cr n , r n ) de G n on introduit 
x n + 1 = Er=i r ™W Vi comme P lus haut et 2/n+i € F(rr n+ i). 

2.1) Soit x* un point d’accumulation de la suite {x n }. Soit e > 0 et N tels 
que xtv_|_i et x m G B(x* y e) pour un m < TV. Considérer un équilibre (<tw,tw) de 
G N = G(xu —,XN\yu ...,2/n) et établir que G S^crjv)} C B(x*,3è) puis que 

G S'(ttv)} C B{x*, 3e). Conclure que Æyv+i £ Go{U z F(z);z G £?(#*, 3e)}. 

2.2 ) En déduire l’existence d’un point fixe pour F. 

Exercice 2. Equilibres parfaits et propres 

Soit G un jeu fini sous forme stratégique donné par un ensemble de joueurs TV, 
des ensembles d’actions z G AT, et des paiements g 1 , i G N. 

1) Existence. Soit e fixé dans ]0, 1[. 

Pour chaque joueur i, on définit rf = el 5 *l/|S' î | et = {a 1 G A(S' l ),a' l (s' 1 ) > 

rf Vs* G S*}, puis on pose E ( 77 ) = n^/ Soit maintenant la correspondance : 

F: Efa) — ► Efa) 
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où pour i dans I et a dans E, 

F\a) = {r* € T, i (ri i )ys i ,t i ,(g i (s i ,a~ i ) < </*(*>-*)) =► tV) < «-*(<*)} 

1.1) Montrer que F est à valeurs non vides. 

1.2) Appliquer le théorème de Kakutani et conclure sur l’existence d’équilibre propre 
et parfait . 

2) Calculer les équilibres de Nash, les équilibres parfaits et propres des jeux à 
deux joueurs suivants : 


T 

M 

B 


Exercice 3. Jeu convexe 

On appelle jeu convexe un jeu à n joueurs donné par des ensembles de stratégies 
Su -, S n , et des fonctions de paiements Gi,..., G n de S = JIîLi dans M tel que : 

a) Si est convexe compact d’un espace Euclidien pour tout i = 1, ...,n. 

b) Gi(.,S-i) est concave sur Si pour tout s_i, pour chaque i. 

c) Ym=\ est continue sur 5. 

d) Gi(si , .) est continue sur S-i pour tout pour chaque i. 

On introduit la fonction $, définie sur S x S par : 

$(M) = E" Gi(si,t-i) 

1) Montrer que t est un équilibre de Nash si et seulement si : 

$(s,t) < $(t,t), Vs G S. 

2) On va prouver l’existence d’un équilibre du jeu convexe. 

Par l’absurde, on suppose dans la suite que pour chaque t il existe un s avec 

®(M) > $(M)- 

2.1) Montrer que la famille 

(Os = {te S; $(s, t) > #(i, t)}) s6S 
forme un recouvrement ouvert de S. 


L R. 


( 1 , 1 ) 

( 0 , 0 ) 

( 0 , 0 ) 

( 0 , 0 ) 


L 

M 

R. 

(1,1) 

(0,0) 

(-9,-10) 

(0,0) 

(0,0) 

(-7,-10) 

(-10,-9) 

(-10,-7) 

(-10,-10) 
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2.2) En déduire l’existence d’une famille finie ( s k )keK avec : 


Vt G S, m ax<Ê>(s fc ,£) > $(M)- 


2.3) Remarquer alors que © définie par : 

@/,\ = ^2keKMt)s k 

() E Mt) 

avec (j>k(t) = ($( s k ,t ) — <!>(£, £))+, est une application continue de S dans lui même. 
En déduire l’existence d’un point fixe t* de ©. 

2.4) Obtenir une contradiction en remarquant que </>&(£*) > 0 implique $>(s k ,t*) > 

$(**,**)■ 


Exercice 4. Jeu de potentiel 

Soit G : S = S 1 -» IR 71 un jeu stratégique fini. On dira que G est un jeu de 
potentiel 4>, avec $ : 5 -> IR si on a : Vâ,Vs*,£ z G S i ys~ l G <S ,_Î 

G*(s\ s -i ) - Gty*,*"*) = $(**,*-*) - 

1) Montrer que G d’une part et le jeu où le paiement de chaque joueur est $ 
d’autre part, ont les mêmes équilibres de Nash . 

En déduire que le jeu G possède (au moins) un équilibre de Nash en stratégies pures. 

2) Exemple 1 : Montrer que le jeu suivant est un jeu de potentiel et étudier ses 
équilibres de Nash 


ai 

0>2 


b\ o 2 


( 2 , 2 ) 

( 0 , 0 ) 

( 0 , 0 ) 

( 1 , 1 ) 


3) Exemple 2 : On considère un jeu de congestion : 2 villes sont reliées par un 
ensemble K de routes. u k (t) dénote le gain de chacun des usagers de la route ft, s’ils 
sont en nombre t. 

Le jeu est donc défini par S 1 = K pour chaque i = 1 ,...,n (chaque usager i peut 
choisir une route s 1 dans K) et si s = (s 1 , s n ) représente le profil des choix, alors le 
paiement d’un joueur i qui choisit s 1 = k est G*(s) = G l (k y s~‘ l ) = u k (t k (s)) où t k (s) 
est le nombre de joueurs j pour lesquels = k. 

Montrer que G est un jeu de potentiel avec : 

$ ( s ) = E,Xr=i )u,C(r) - 

4) Soit G un jeu quelconque de potentiel <Ê> et soit = A (5 l ). On note encore 
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par G et $ les extensions multilinéaires à E = Il^E 1 (comme dans l’exercice 3). 

On considère la dynamique du réplicateur sur x G E partant d’un point intérieur (i.e. 
x l (s l )(0) > 0 pour tout i et s 1 G S 1 ) x(0) G E, Vi,Vs l G S 1 : 

*V)W = *V)W[GV,* _< (*)) - G*(*(t))] 

où est la probabilité que le joueur i joue s 1 à l’instant t (qui peut être inter- 

prétée comme étant la proportion des agents de type s 1 dans la population i à l’instant 

t). 

Montrer qu’elle s’écrit aussi, Vi,Vs* G S l : 

*V)w = - $(*(*))]. 

On pose <j)(t ) = $(x(t)). Etablir que : 

*(*) = £, *(**(*)’*■*(*)) 

avec 

*(**(*), *-*(*)) = *■*(*)) 

Vérifier que 

0 = E.^VXOPK**, *"*(*)) - <&(*(*))]*(*(*)) 

donc que 

*(xXt),X-\t)) = - *(s(*))] 2 

En déduire, puisque </> est bornée, que la dynamique converge vers l’ensemble des 
équilibres de Nash. 

5) Les notations sont comme dans la question 4) et on considère maintenant la 
dynamique sur E de meilleure réponse qui est définie par : 

x\t)eMRÏ[x-\t)\-x(t), 

où MR^x^] = {x i G E 4 ; <?*(*) > G i (s\x~ i ) i \/s i G S*}. 

On pose F‘ l (x~ l (t)) = max s i eS i$(s' L y x~ l (t)) et c/>(t) = $(x(t)). Montrer que 

m = £<[•(**(*) + x\tu-\t)) - «(*(*))] = - *(*(*))]• 

En déduire que tout point d’accumulation de la dynamique est un équilibre. 
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7. Feuille n°7 


Exercice 1. GNIM 

Pour n,ra deux entiers strictement positifs, on définit le jeu à deux joueurs 
G(n, m) suivant. Soit P(n, m) l’ensemble des points du plan IR? à coordonnées en- 
tières positives ou milles dont Pabcisse est inférieure ou égale à n et dont l’ordonnée 
est inférieure ou égale à m. Une pierre est placée sur chacun de ces points. Le joueur 

1 joue en premier. Il choisit une pierre et enlève toutes les pierres dont les deux coor- 
données sont supérieures ou égales à celles de la pierre choisie. C’est ensuite au joueur 

2 de jouer selon la même règle. Le jeu se poursuit en alternant les joueurs. Celui qui 
prend la dernière pierre (i.e. (1,1)) a perdu. On définit de même le jeu G(oo,oo) en 
prenant tous les points à coordonnées entières positives ou milles, et les jeux G(n, oo) 
et G(oo,m). 

1) Montrer que dans le jeu G(n, m), le joueur 1 a une stratégie gagnante (on ne 
demande pas de la trouver). 

2) Trouver une stratégie gagnante pour (7(n,n). 

3) Etudier le jeu quand n (et/ou m) est infini (commencer par le cas n = 2 et 
m = oo). 

Exercice 2. Poker simplifié 

Deux joueurs jouent un jeu à somme nulle. La mise est de 1 par joueur pour com- 
mencer le jeu. Un jeu de 32 cartes est battu, et le joueur 1 tire 1 carte et la regarde. 
Le joueur 2 ne voit pas la carte. 

Le joueur 1 décide alors soit de se coucher (abandon, et il donne alors sa mise au 
joueur 2), soit de doubler sa mise. Au cas où le joueur 1 a doublé la mise, le joueur 
2 décide alors soit de se coucher (alors le joueur 1 gagne la mise initiale 1 du joueur 
2), soit de doubler sa mise également. Dans ce dernier cas, le joueur 1 dévoile la carte 
tirée : si elle est Rouge, le joueur 1 ramasse toutes les mises (donc a gagné 2 ) ; si elle 
est noire, le joueur 2 ramasse les mises (donc a gagné 2 ). 

Mettre ce jeu sous forme extensive, puis sous forme normale. Quelle est la va- 
leur du jeu ? Quelles sont les stratégies mixtes optimales des joueurs ? Que sont les 
straégies de comportement optimales ? 

Exercice 3. Une drôle d’enchère 

Deux acheteurs potentiels participent à une enchère pour déterminer celui qui va 
remporter un bien donné. Le joueur i lui accorde une valeur On a v\ > V 2 > 0. 
Chaque joueur i fait une enchère bi > 0. Celui qui fait la plus grande offre remporte 
l’objet mais paye l’enchère de son adversaire (c’est à dire le second prix &_*). Quant 
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au perdant, il ne remporte pas l’objet mais est quand même contraint de payer l’offre 
qu’il a faite (c’est en ceci que notre enchère diffère d’une enchère au second prix clas- 
sique). En cas d’égalité, le joueur 1 est désigné comme le gagnant et les mêmes règles 
s’appliquent. On ne considère ici que des stratégies pures. 

1) Formulez le problème sous forme d’un jeu stratégique. 

2) Existe-t-il un équilibre de Nash tel que b\ > 0 et b 2 > 0, c’est à dire dans lequel 
les deux joueurs font une enchère strictement positive ? 

3) 61 = 62 = 0 est-il un équilibre de Nash? 

4) Si bi = 0 et bj > 0, sous quelle condition sur bj le joueur i n’a pas intérêt 
surenchérir. 

5) Donnez l’ensemble des équilibres de Nash. Le gagnant est-il nécessairement 
celui qui a la plus grande évaluation a priori de l’objet ? Combien paye le gagnant 
pour obtenir l’objet ? 

Exercice 4. Double enchère 

Un vendeur (joueur 1) et un acheteur (joueur 2) négocient la vente d’un bien 
indivisible. Le coût pour le vendeur est c et la valeur pour l’acheteur est v. cet v sont 
indépendants, tirés selon la loi uniforme sur [0, 1]. Le vendeur et l’acheteur soumettent 
simultanément des offres 61 et b 2 . Si b\ > l’échange n’a pas lieu. Sinon, l’échange 
a lieu et le prix est fixé à (61 + 62)/ 2. 

1) Calculer les paiements des deux joueurs. 

2) On suppose que l’information est complète (i.e. v et c connus des deux joueurs) 
et que v > c. Montrer qu’il existe un continuum d’équilibres en stratégies pures. 

3) On suppose que l’information est privé donc le jeu est à information incomplète 
et on cherche un équilibre en stratégies pures b\(c) et 6 2 (v). Montrer que 6i(-) et 6 2 (-) 
sont nécessairement croissantes. 

4) En supposant les bi(-) strictement croissantes et C 1 , donner le couple d’équa- 
tions différentielles caractérisant les équilibres. Chercher un couple de solutions affines. 
A quelle condition y a t-il échange ? 

Exercice 5. Corrélation sur un signal 

On considère le jeu suivant : 


U 

D 


L R. 


5,1 

0,0 

4,4 

1,5 
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1) Calculer les équilibres de Nash (purs et mixtes) de ce jeu et les paiements 
d’équilibre correspondants. 

On suppose que les deux joueurs considèrent avant le jeu la procédure suivante : 
on tire à pile ou face (événements équiprobables) ; après avoir observé le résultat, 
chaque joueur joue comme suit : 

Si le résultat est PILE : 1 joue U et 2 joue L 
Si le résultat est FACE 1 joue D 2 joue R. 

Toutefois, une fois le jeu commencé, rien n’oblige un joueur à respecter cette procé- 
dure. 

2) Montrer qu’une fois le jeu commencé, chaque joueur respecte la procédure 
(c’est à dire qu’aucun des joueurs n’a de déviation profitable). 

On a en fait considéré une extension du jeu, et la situation décrite est donc un équilibre 
de Nash du nouveau jeu. 

3) Quel est le paiement de ce nouvel équilibre ? 

4) Quel est l’ensemble des paiements atteignables par ce procédé (coordination 
sur un signal public) lorsque la loi du signal aléatoire varie ? 

On suppose maintenant que les joueurs peuvent réagir conditionnellement à des 
signaux différents mais corrélés. Pour illustrer ce cas, on suppose qu’une variable aléa- 
toire possède trois états équiprobables A, B et C. Le joueur ligne ne peut distinguer 
les états B et (7, et le joueur colonne ne peut distinguer les états A et B. Les joueurs 
s’accordent sur la procédure suivante : 

Joueur 1 : si A, jouer £/, si {B,C} jouer D 
Joueur 2 : si { A, B } jouer L, si C jouer R. 

Une fois le jeu commencé, rien n’oblige un joueur à respecter cette procédure. 

5) Vérifier qu’il s’agit bien d’un équilibre de Nash du jeu étendu, c’est à dire 
qu’une fois le jeu commencé, les joueurs respectent la procédure. 

6) Calculer la probabilité d’occurrence de chaque issue du jeu initial. Quel est le 
paiement espéré des joueurs ? Ce paiement appartient-il à l’ensemble des paiements 
atteignables par le procédé introduit initialement (question 4) ? 

Exercice 6. Marchandage 

Deux joueurs négocient pour diviser 100 euros. Ils reçoivent zéro si aucun accord 
n’est conclu. Nous allons analyser plusieurs modèles de jeux de marchandage avec 
offres alternatives. 

1) (Jeu de l’ultimatum) Le joueur 1 commence par proposer un partage (soit 
100 — x pour lui et x pour l’autre joueur), avec x > 0. L’autre joueur peut accepter 
et dans ce cas le partage se fait ou refuser (et dans ce cas ils reçoivent chacun zéro). 
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Ecrire la forme extensive du jeu et montrer qu’il existe un unique équilibre S- 
parfait. 

2) Maintenant le jeu en 1) est joué n fois avec une alternance des offres entre 
les joueurs. Le joueur 1 commence par proposer un partage. Le joueur 2 accepte ou 
refuse. Si le partage est accepté il se fait, sinon la somme à partager est divisée par 
deux (soit = 50 euros) et les rôles sont inversés : maintenant c’est au tour du 
joueur 2 de faire une proposition de partage. Le joueur 1 peut accepter ou refuser. 
S’il accepte, le partage se fait sinon, la somme est encore divisée par deux et les rôles 
encore inversés. Trouver le (l’unique) paiement d’équilibre sous jeu quand n tend vers 
l’infini ? 

3) (Rubinstein 1982) On suppose ici que le jeu dure infiniment avec des offres al- 
ternatives comme en b). Maintenant la somme à partager est multipliée (après chaque 
refus) par un facteur 0 < S < 1 (qu’on peut interpréter comme un taux d’escompte, 
ou comme la probabilité que le jeu continue ou encore comme le degré d’impatience 
des joueurs). 

Montrer que la stratégie suivante est un équilibre sous jeu parfait : le joueur qui 
doit faire l’offre propose la fraction de la somme à partager pour lui et offre à 
l’autre joueur le reste. Celui-ci accepte toute offre lui donnant au moins cette propo- 
sition et refuse toute autre offre. 

Pour conclure, montrer que c’est l’unique équilibre sous jeu parfait. 

Exercice 7. Jeu sous forme extensive 

Soit G un jeu fini sous forme extensive, sans coup de la chance. Soit G' un jeu 
obtenu à partir de G en raffinant certains ensembles d’information. 

1) Soit g un équilibre en stratégies pures de G. Montrer que g reste un équilibre 
dans G'. 

2) Le résultat dans 1) reste-il vrai si on remplace le mot “pures" par “mixtes" ? 
(sinon trouvez un contre-exemple) 

3) Le résultat dans 1) reste-il vrai si il y a un coup de la chance? (sinon trouvez 
un contre exemple). 

Exercice 8. Les piles de jetons 

Voici les règles d’un jeu simple consistant à enlever des jetons d’une pile. 

a) Il y a deux joueur, I et II. 

b) Il y a une pile de 21 jetons au centre de la table. 

c) Une action consiste à ôter un, deux ou trois jetons de la pile. Au moins un jeton 
doit être enlevé et pas plus de trois. 

d) Les joueurs jouent à tour de rôle, I commence. 
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e) Le joueur qui prend le dernier jeton a gagné. (Le dernier joueur qui ôte un jeton 
gagne. Si vous ne pouvez enlever aucun jeton, vous avez perdu.) 

1) Quel joueur préféreriez vous être, celui qui commence ou le second? Quelle est 
une bonne stratégie ? est ce que la stratégie optimale est unique ? 

2) Quelle est le joueur gagnant en fonction de n, où n est le nombre initial de 
jetons. 

Exercice 9. Entrant et information incomplète 

On considère deux entreprises, l’une en place sur le marché (entreprise 1) et 
l’autre un entrant potentiel (entreprise 2). Suivant un événement aléatoire (décidé 
par la nature), l’entreprise 1 peut faire une innovation technologique (I) ou pas (P). 
Les événements I et P ont chacun probabilité 1/2. Si I est réalisé, l’entreprise 1 sera 
en mesure de battre n’importe quel concurrent. 

Le déroulement du jeu est le suivant. 

- I ou P se réalise de manière équiprobable. L’entreprise 1 est informée de cette 
réalisation mais pas l’entreprise 2. 

- L’entreprise 1 décide de sortir du marché (S) ou de rester (R). Si elle sort, 
l’entreprise 1 fait un bénéfice de 0 et l’entreprise 2 (en position de monopole) 
fait un bénéfice de 4. 

- Ayant observé le choix de l’entreprise 1, si celle-ci reste sur le marché, l’entre- 
prise 2 choisit d’entrer sur le marché (E) et de faire concurrence à 1 ou de rester 
en dehors (D) 

- Si l’entreprise 2 reste en dehors, le bénéfice de l’entreprise 1 est de 4 et 
celui de l’entreprise 2 de 0. 

- Si l’entreprise 2 entre et que 1 est réalisé, le bénéfice de l’entreprise 1 est 
de 8 et celui de l’entreprise 2 de -4. 

- Si l’entreprise 2 entre et que P est réalisé, le bénéfice de l’entreprise 1 est 
de -4 et celui de l’entreprise 2 de 8. 

1) Modéliser cette situation par un jeu sous forme extensive. 

2) Donner la forme normale de ce jeu. 

3) Calculer le ou les équilibres. 
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8. Feuille n°8 

Exercice 1. Valeur de l’information (Kamien, Taumann et Zamir, 1990) 

On considère le jeu à 2 joueurs suivant : 

- étape 0 : une couleur (noir ou blanc) est choisie au hasard avec probabilité (1/2, 1/2). 

- étape 1 : le joueur 1 annonce une couleur et ce choix est communiqué au joueur 2. 

- étape 2 : le joueur 2 annonce une couleur. 

Le paiement est 2 pour chacun des joueurs si ils annoncent la même couleur et sinon 
5 pour celui qui annonce la couleur tirée initialement et 0 pour l’autre. 

1) Décrire le jeu sous forme extensive, puis sous forme normale et montrer qu’il 
possède un unique paiement équilibre (5/2, 5/2). 

2) On suppose désormais que le joueur 1 est informé du tirage initial (et que le 
joueur 2 le sait). Décrire le nouveau jeu sous forme extensive et montrer qu’il a un 
unique paiement d’équilibre. 

3) Etudier enfin la situation où le joueur 2 seul est informé puis celle où les 2 
joueurs connaisent le tirage initial. 

4) Que peut-on dire de la “valeur de l’information” ? Quelles sont les hypothèses 
sur la connaissance des agents pour qu’ils puissent la calculer ? 

Exercice 2. Transmission stratégique d’information 

On considère une interaction à deux joueurs dans laquelle un état de la nature 
k = 1,2 est choisi au hasard de manière équiprobable. Cet état est observé par 
le joueur 1 mais pas par le joueur 2. Le joueur 1 doit alors envoyer un message 

m € {A, B) au joueur 2. Le joueur 2 devra choisir une action s e {G, M, D}. Le 

paiement de chaque joueur dépend uniquement de k et s. Les couples de paiements 
sont les suivants : 

Etat k = 1 i G — y (0,6) > M — y (2,5) î D — y (0,0). 

Etat k = 2 : G -y (0,0) ; M -> (2,5) ; D -> (2,12). 

1) Ecrire la forme extensive de ce jeu en précisant les espaces de stratégies. 

2) Déterminer les équilibres de Nash en stratégies pures de ce jeu. On distinguera 
notamment suivant le nombre (1 ou 2) de messages différents envoyés par le joueur 
1. Calculer les paiements d’équilibre pour chaque joueur. Quel est l’équilibre le plus 
favorable au joueur 1 ? 

3) Montrer que le couple de stratégies suivant est un équilibre. 

Joueur 1 : jouer A si k = 1 et (A avec probabilté 1/2 ; B avec probabilité 1/2) si 
k = 2; 

Joueur 2 : jouer M si A et D si B. 
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Calculer le paiement de cet équilibre. Le joueur 1 a t-il intérêt à révéler son information 
(complètement, pas du tout, partiellement) ? 

Exercice 3. Équilibre corrélé versus Nash 
A) Montrer que le jeu suivant 



b i 

&2 

b 3 

a\ 

(— oo, — oo) 

(3,1) 

(0,2) 

a% 

(1,3) 

(0,0) 

(1, oo) 

a 3 

(2,0) 

(-00,1) 

(0,0) 


ne possède pas d’équilibre de Nash mais que toute distribution de la forme 



b i 

b 2 

&3 

ai 

0 

a 

0 

Q>2 

0 

7 

0 

a 3 

0 

0 

0 


avec a /^7 > 0 est une distribution d’équilibre corrélé. 

B) (Peleg) Soit le jeu avec un nombre infini dénombrable de joueurs {1, 2, ..., n, ...} = 
IN*. On suppose que tous les joueurs ont seulement deux stratégies 0 ou 1 (soit 
Si = {0, 1}). La fonction de paiement du joueur i est : 


9i(s) 


Si) 


si S j s 3 < 00 


~Si 


sinon. 


1) Montrer qu’il n’existe pas d’équilibre de Nash en stratégies pures. 

2) En utilisant le lemme de Borel Cantelli montrer qu’il n’existe pas d’équilibre de 
Nash en stratégies mixtes. 

3) Montrer que la distribution fi = ^ sur S = JJ* Si = {0» 1}^* induit un équi- 
libre corrélé, où /Xi est la distribution (produit) \x i = avec : lA( s i = 1) = \ et 

/x 2 est la distribution (jointe) qui tire le profil (si = 1, ...s* = 1, = 0 , ..., s n = 0 , ...) 

avec probabilité \ - ^ 

(Remarquer que s» = oo) = 1, que P M2 (^ Sj = oo) = 0 et que P M2 (sj =!) = }•) 


Exercice 4. Corrélé via minmax (Hart et Schmeidler, 1989) 

Soit G un jeu stratégique à 2 joueurs, décrit par les espaces de stratégies S 1 et S 2 
et le paiement g : S = S 1 x S 2 — y IR 2 . On considère le jeu T à 2 joueurs et à somme 
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nulle où les espaces de stratégies sont S et L = (S 1 ) 2 U (5 2 ) 2 et le paiement 7 avec : 
7 = (&*(**, s~*) -3 i (u i ,s -i ))l{ t i =si} 

1) Vérifier que le jeu a une valeur v et des stratégies optimales. 

2) Montrer que si v > 0 et Q € A (S) est une stratégie optimale du joueur 1, alors 
Q est une distribution d’équilibre corrélé dans T. 

3) Soit 7 r € A (L). On définit une probabilité de transition sur S 1 , p 1 par : 

p l (t l \u l ) = 7r(^ 1 ,n 1 ),si t 1 ^ u 1 
p\t\t 1 ) = l-^^TT^U 1 ). 

Soit p 1 une probabilité sur S 1 invariante par p 1 : 

On définit p 2 et /x 2 de la même manière et l’on pose p = p 1 x p 2 . Montrer que le 
paiement 7 (/x; 7r) se décompose en termes de la forme 

rt* 1 ' ul )(5 1 (* 1 . •) - •)) 

et en déduire : 

V7 r e A(L), 3 (j) e A(S) satisfaisant : 7(0, 7r) > 0. 

4) Etablir alors l’existence d’équilibres corrélés dans G. 

5) Etendre la démonstration aux jeux à n joueurs. 

Exercice 5. Équilibre corrélé : somme nulle 

1) On se place dans un jeu fini à 2 joueurs et à somme nulle défini par une matrice 
A = G 1 = —G 2 . On note S 1 l’ensemble des stratégies pures du joueur 1, S 2 l’ensemble 
des stratégies pures du joueur 2, et S = S 1 x S 2 . On rappelle qu’une distribution d’ 
équilibre corrélé (DEC) est un élément n de A (5) (l’ensemble des probabilités sur S) 
tel que, pour tout joueur i et tout couple de stratégies (s 1 , t % ) € S 1 x S 1 on a 

Le paiement (total espéré) du joueur i est G l (n) = ^ 2 se s n ( sl ^ s2 )^ l ( sl ^ s2 )' 

1.1) Montrer que le seul paiement d’équilibre corrélé 7 r est (u, — u), où v = valA 
1.2) Soit 7r une DEC de A, et s 1 une stratégie pure du joueur 1 qui a une probabilité 
positive sous 7r. Montrer qu’alors la probabilité conditionnelle 7r(.|s 1 ) € A(S 2 ) est une 
stratégie optimale du joueur 2. 
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2.) On considère le jeu suivant à somme nulle 


a i 
a>2 
<23 

2.1) Etablir que 

ai 

0>2 

«3 


&i 62 63 


1/3 

1/3 

0 

1/3 

0 

0 

0 

0 



01 02 ^3 


0 

0 

1 

0 

0 

-1 

-1 

1 

0 


est une distribution d’équilibre corrélé. 

2.2) Est-ce une distribution qui est le produit de stratégies optimales des joueurs? 

2.3) Décrire l’ensemble des DEC. 

Exercice 6. Équilibres corrélés et équilibres de Nash 

1) Donner tous les équilibres de Nash en stratégies mixtes du jeu à deux joueurs 
suivant : 

H 
B 

2) Considérons le jeu à trois joueurs suivant. Le joueur 1 a deux actions : H ou 
B. Le joueur 2 a deux actions : G ou D. Le joueur 3 a une infinité d’actions : il choisit 
un entier relatif 2 . Les paiements sont les suivants : 


G D 


( 2 , 2 ) 

( 0 , 0 ) 

( 0 , 0 ) 

( 2 , 2 ) 



G 

D 


G 

D 


G 

D 

H 

(2,2,3+ 1 /z) 

(0,0,8) 

H 

(2,2,2) 

(0,0,0) 

H 

(2,2,0) 

(0,0,0) 

B 

(0,0,0) 

(2,2,0) 

B 

(0,0,0) 

(2,2,2) 

B 

(0,0,8) 

(2,2,3 — 1/z) 


z < 0 z = 0 z > 0 


Le joueur 1 choisit la ligne, le joueur 2 la colonne, le joueur 3 la matrice. Ainsi, si le 
joueur 1 choisit H, le joueur 2 G et le joueur 3 z = —4, les joueurs 1 et 2 ont chacun 
un paiement de 2 et le joueur 3 a un paiement de 2,75. 

2.1) Montrer que ce jeu n’a pas d’équilibre de Nash. 

2.2) Montrer qu’il existe un équilibre corrélé dans lequel le joueur 3 joue z = 0. 
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9. Eléments de correction 
Feuille 1 


Exercice 1 : 

1) L’algorithme est bien défini car si un homme a épuisé sa liste, il est passé chez 
toutes les femmes. Donc chacune des femmes a eu au moins un homme chez elle, et a 
donc exactement un homme chez elle, ce qui a terminé l’algorithme. 

Pour montrer que l’algorithme s’arrête en moins de n 2 jours, on peut considérer la 
variable d’état qui indique, pour chaque homme, le nombre de femmes qu’il a visitées. 
L’algorithme s’arrête si l’un des hommes a visité les n femmes. Tant que l’algorithme 
continue, au moins un homme visite une nouvelle femme le lendemain. 

2) 1er exemple : 3 mariages stables : ((a, A), (6, Æ), (c, C)), ((&, A), (c, £?), (a, C)) 
et 

((c,A),(a,£), (6, CT)). 

2ème exemple : un unique mariage stable : ((c, A), (d, B ), (a, C), (6, D)). 

3) OK par contradiction 

4) Soient, par exemple, 4 étudiants A, £, C, D où : D est le moins préféré de 
chacun des 3 autres étudiants, et A préfère en premier B , B préfère en premier C, et 
C préfère en premier A. 

5) idem avec l’algorithme où : chaque étudiant postule d’abord à son école pré- 
férée, puis à son 2ème choix en cas de refus etc... et une école de quota q gère une 
liste d’attente comprenant ses étudiants préférés (au maximum q) parmi ceux qui se 
sont présentés chez elle. L’algorithme termine si chaque étudiant est soit sur une liste 
d’attente, soit rejeté partout. Les listes d’attente sont alors déclarées admises. 

Exercice 2 : 

1) Notons x* = / _1 (l/2) et y * = y _1 (l/2). En s’arrêtant en x*, le joueur 1 ga- 
rantit 1/2. En s’arrêtant en y*, le joueur 2 garantit 1/2. Remarquons que le joueur 1 
n’a jamais intérêt à s’arrêter avant x*, et le joueur 2 avant y *. 

2) Si x* < y*, il est vraisemblable que les 2 joueurs arrêtent en y*, avec un paie- 
ment /(y*) pour le joueur 1 et 1/2 pour le joueur 2. Si x* > y*, il est vraisemblable 
que le joueur 1 s’arrête en x*, et le joueur 2 très légèrement avant x* (voir la notion 
de e-équilibre). 

3) pas de réponse claire, une possibilité pour le joueur 1 (resp. joueur 2) est de 
couper en x* (resp. y*), ce qui constitut une stratégie prudente garantissant au moins 
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1/2 dans tous les cas. 

4) non (on peut penser à un gâteau avec une framboise du côté gauche et une 
pépite de chocolat du côté droit, avec le joueur 1 qui adore la framboise et le joueur 
2 qui adore le chocolat). 

Exercice 3 : 

1) (%t)t est décroissante positive, et Xt > 0. 

t — y oo 

2) u(V,x ) = x, et u(B,x) = x — 1/2 pour tout x. 

3) On a y t = de f ( x t - 1/3) 2 > 0. 

4) et 5) dessiner. 

Exercice 4 : 

Fixons un joueur i, notons pi le prix proposé par ce joueur, p_i = (pj)j^i le vec- 
teur des prix des autres joueurs, et p* = ma x^pj. L’utilité du joueur i vaut 0 si 
Pi < p*, elle vaut Vi — p * si Pi> p*, et elle est comprise entre 0 et Vi — p* si p* = p*. Il 
faut montrer que Ui(v^p-i) > Ui(p^p-i) pour tous Pi et p_*. 

Si Vi > p*, on a = Vi - p* > 0 et - p* > Ui(p iy p-i). 

Si Vi = p*, on a u*(t;<,p_<) = 0 = Ui(p iy p-i). 

Si Vi < p*, on a Ui(v i9 p-i) = 0 > Ui(pi,p~i). 


Feuille 2 


Exercice 1 : 

1.1) sup, inf existent et sont atteints : A (J) et A (J) sont compacts. 

Si Ao > p- 0 ) alors so(A — po B) > 0. Contradiction avec ( A — fioB)to < 0. Donc on 
suppose Ao < po- 

1.2) Si oui, alors (A — XoB)to > 0. Contradiction avec so(A — Ao B) = 0. 

1.3) Pour faciliter l’écriture, supposons sans perte de généralité que les colonnes 
de J' se trouvent toutes “au début” : J = {1,...,|J|} et J' = {1, ..., | J'|}. On a 
so(A — Ao-B) = (0, ...,0, > 0, > 0, ..., > 0), où les 0 correspondent aux éléments de J' 
et les > 0 à ceux de J\J'. 

On se restreint aux composantes I x J' de A et B. On trouve u', s' par hypothèse 
de récurrence. On a s'(A — v'B) = (> 0, ..., > 0, ?, ..., ?). 

L’ensemble {p, 3t G A (J'), (A - pB)t < 0} est inclus dans {p, 3t G A (J), ( A - 
p,B)t < 0}, donc on a v f > po (intuition claire : moins de stratégies pour J2 ==> moins 
bien pour J 2). 
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D’où v' > Ao. Donc s'(A-XoB) = (> 0, ...,> 0,?,?,...,?). Alors il existe a G (0,1) 
tq (as' + (1 - a)so)(A - Ào B) = (> 0, ..., > 0, ...,> 0). Enfin il existe A > Ao tq 
(as'+ (1 — a)so)(A — A B) = (> 0, > 0, > 0). Contradiction avec la définition de 
A 0 . 

1.4) par récurrence (démonstration symétrique s’il existe I' ^ I tel que : 
(Aito - fioBito = 0 ssi i G /')). 

2) Prendre B avec que des 1. 

3) Prendre A = Id. Il existe s et t tels que s > vsB et t < vBt . Comme t < vBt , 
nécessairement v > 0. Comme s(Id — vB) > 0, vue la forme de Id — vB la stratégie s 
a support plein. Comme s(Id — vB)t = 0, il vient ( Id — vB)t = 0. Bt = t est un 
vecteur propre pour B. t e A(7), donc toutes les coordonnées de Bt sont strictement 
positives. Et alors t aussi a toutes ses coordonnées strictement positives. 

Exercice 2 : 

Notons a = max( æ>2/) min Z g(x,y,z). a = maX( xy)e[0A] 2 min{xy,(l - x)(l - y)}. 
Posons a = xy et b = (1— x)(l —y), ab = x(l—x)y(l—y) < 1/16, donc min{a, b} < 1/4, 
et a < 1/4. Prendre x = y = 1/2 donne a = 1/4. 

Notons P = mm z max.( Xy y)g(x,y,z). P = min zG [ 0> i] max{z, 1 — z} = 1/2. 

On a donc a < fi. 

Remarque : autorisons maintenant les joueurs 1 et 2 à corréler leurs actions, c’est-à- 
dire à jouer une stratégie t G A ({üT, B} x {G, D}). Notons g(t y z) l’espérance de g sous 
la probabilité induite par t et z. On a alors max* min z g(t y z) = min z max* g(t , z) = 1 /2. 

Exercice 3 : 

1) Notons v = limsupu n . Soit e > 0 fixé. On prend n tq v n > v — e, et tq : 
( \ x ~ v\ — 2 ti + a ) entraîne |/(x) - f(y)\ < e. 

Considérons a n optimale pour J 1 dans G n . Soit t dans [0, 1] une stratégie du J2. 
Il existe t n dans Y n tel que 1 1 — t n \ < On a : 

/(^n, t) = /(a n , t n ) + J* /(s, t) - /(s, t n )d<j n (s) >v-e-e. 

Donc /(a n , r) > v — 2e pour tout r et a n garantit v — 2e dans G. Le J1 garantit 
donc lim sup n v n dans G (à e: près pour tout e >0). 

De même, on montre que le J2 garantit liminf n t; n (à e près pour tout e > 0). Donc 
nécessairement liminf n u n > limsup n u n . D’où {v n ) n converge vers u, et v est la valeur 
de G. 

2) Pour tout n, on considère a n optimale du J1 dans G n , et F n : M — > [0, 1] la 



142 


Chapitre 9. Exercices 


suite de fonctions de répartition associée. 

(Par exemple), on peut trouver, en appliquant le théorème de Tychonoff, une 
sous-suite (i^( n ))n qui converge simplement vers une fonction F : R — > [0,1], F 
est croissante, F( 0) = 0 et F( 1) = 1, mais F n’est pas nécessairement continue à 
droite. Notons F sa régularisée s.c.s., i.e. F(x) = inî £> os\ip yeB ( x ^ F(y). Alors F 
est continue à droite, c’est la fonction de répartition d’une loi de probabilité a sur 
[0,1]. On a maintenant convergence simple de F n (x) vers F(x) en tout point x de 
continuité de F. Donc (cr n ) n converge eh loi vers a : pour tout g : [0, 1] — > R conti- 
nue, E (g((T n )) converge vers E(g(a)). On applique pour chaque t à g = /(.,£), et on 
obtient : f (a, t) > v pour tout t. Donc a est une stratégie optimale du J1 dans G (et 
de même le J2 a une stratégie optimale). 

Remarque : on a (re)demontré que A([0, 1]) est compact pour la topologie de la conver- 
gence en loi (topologie faible-*). 


Exercice 4 : 

1) Soit y n = U c {x n ) alors : 

d n+l < ||®n+l - Vn\\ 2 = ||*n ~ Vn\\ 2 + \\x n +l ~ X n \\ 2 + 2(x n+ i - X n ,X n - y n ) 


qui se décompose 

(^n+i — x ni x n — y n ) = ( — — )(x n +i — x n ,x n — y n ) 

Tt J. 

= (— X7)«*n+1 - Vn,X n ~ J/ n ) ~ ||*n ~ Vnf)- 
71/ —J— J. 

Nous obtenons alors en utilisant l’hypothèse : 


Puisque 
on déduit 


4+1 < (1 - ) 4 + (^y) 2 |bn+l - XnW 2 . 

Il*«+1 - x n \\ 2 < 2\\x n+l f + 2||x n || 2 < 4M 2 , 


D’où par récurrence : 
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2.1) Nous avons, par construction (s n+ iA,t n+ i) > 0, autrement dit 

3'Ti) ^ 0 

ou encore que (x n +i, x n — x%) < 0. Puisque (x+, x n — x+) = 0 cela implique 

(x n+ i - x+, x n - x+) < 0 

et il suffit de remarquer que x+ = ïlc(x n ). 

2.2) Il suffit d’interpréter les fréquences empiriques dans x n comme une stratégie 
mixte du joueur ligne. 


Exercice 5 : 

1) En jouant a\ le joueur 1 assure un paiement > 1. En jouant &i le joueur 2 
assure que le paiement (du joueur 1) est < 1. Donc la valeur vaut 1, quel que soit x. 

La seule stratégie optimale du joueur 2 est b\ (considérer la stratégie a\ du joueur 

1) . La seule stratégie optimale du joueur 1 est a\ (considérer la stratégie b\ du joueur 

2) . Ceci est valable pout toute valeur de x. 

2) La stratégie a<i est strictement dominée par 0,51 a 3 + 0,49 a\. Donc on peut 
l’éliminer pour calculer la valeur et les stratégies optimales. 


ai 

Soit (x, y) un couple de stratégies optimales (x étant la probabilité que le joueur 1 
joue ai, y celle que le joueur 2 joue b\). Il est facile de voir que x = 1 et x = 0 sont 
impossibles, donc x G]0, 1[, ce qui implique : 3y — (1 — y) = —2 y + (1 — y). D’où 
y = 2/7. 2/7 e]0, 1[, donc 3x - 2(1 — x) = -x + (1 - x), soit x = 3/7. Il y a donc une 
unique stratégie optimale pour chaque joueur, et la valeur est le paiement donné par 
ces stratégies, soit 1/7. 


b\ & 2 


3 

-1 

-2 

1 


Exercice 6 : 

Il suffit de remarquer que jouer la stratégie i avec probabilité 

joueur indifférent entre toutes ses stratégies, avec le paiement v = 
la valeur du jeu. 


n a - — y ren d l’autre 
2-r? = l ~à~j 

: —â — J-. v est donc 

^3 = 1 CLj 
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Feuille 3 


Exercice 1 : 

1) la fonction de gain du joueur 1 est : 


{ Pi 0*0 + (1 - pi(x) (-1) = 2pi(x) - 1 si x<y 

Pi 0*0(1 - P 2 (x)) + p 2 {x) (1 -pi(x))(-l) =Pi(x)-p 2 (x) si x = y 

(-l)P2(y) + (l - Pi(y) = l - 2 p2(y) x>y 

Soit to G]0, 1[ tel que p\ (t o) + ^ 2 (^ 0 ) = 1. On montre que g(to,to) = 2pi(t 0 ) — 1, 
que g(tü,y) > 2pi(£ 0 ) — 1 pour tout y , et que g(x,to) < 2pi(to) — 1 pour tout x. 
Donc (£ 0 , £ 0 ) est un point-selle du jeu. La stratégie optimale d’un joueur est de tirer 
à l’instant même où la probabilité de tuer l’adversaire égale la probabilité de survie. 
A l’équilibre les joueurs tirent en même temps. 

2) On peut montrer le résultat par récurrence, en notant ( Hk ) l’hypothèse : 

( H k ) Quand il y a (m, n) balles et que m + n < K, la valeur en stratégies pures 
existe et vaut et une stratégie optimale du joueur qui a ma x(m,n) balles est de 

tirer pour la première fois à t = 

( H\ ) est vraie. Supposons ( Hk ) vraie pour un K > 1, et notons (m',n) = 
(m + 1, n) le nombre de balles. On peut facilement supposer que n > 0 et m! > 0. On 
fait 3 cas selon le joueur qui a le plus de balles. 

Cas 1 : m' > n > 0. On définit la stratégie a du joueur 1 qui : face à une histoire 
silencieuse, tire pour la première fois en date m+ ^ +1 puis en cas d’echec joue une 
stratégie optimale du jeu (m, n) ; et si le joueur 2 tire et rate avant , le joueur 

1 joue une stratégie optimale du jeu (m + 1, n — 1). 

Si le J 2 ne tire pas avant m ^ +1 -, le joueur 1 utilisant a gagne au moins : 

1 + m + n m — n_m + l — n 

ra + n + 1 m + n+1 ra + n ra + n+l’ 

Si le J2 tire en m ^~^ 1 < m+ ^_ jl - 1 - , le joueur 1 utilisant a gagne au moins : 


1 — e 

m + n+1 


(-1) + 


m + n + £ 
m + n + 1 


m + 1 — (n — 1) m + 1— n + e 
m + n > m + n+1 


Et si le J2 tire pour la première fois exactement en — ,^+i > j° ueur 1 utilisant cr 

gagne au moins : 


0 + 


m + n 
m + n + 


O 


2 


m-n + 1 m+1— n 

m + n— 1 m + n + 1* 
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Par conséquent, g garantit ^+^44 au joueur 1. 

Définissons maintenant, pour e > 0 petit, la stratégie aléatoire r du joueur 
2 qui, face à une histoire silencieuse, tire pour la première fois selon la loi uni- 
forme sur [ m+ ^ +1 , ra+rc+J , et joue optimalement dès qu’une balle a été tirée. Si 
le joueur 1 tire pour la première fois avant le joueur 2, son paiement est au plus 
+ m+n+i 2+1 ^ m m|;+î £ • Si le J oueur 1 tire P our la première fois après le 
joueur 2, le paiement du joueur 1 est au plus ^+r(-l) + m +£+i m £l~ n n = 

Le joueur 2 garantit également (à e-près pour tout e), qui est donc la 

valeur du jeu (notons que le J 2 n’a pas de stratégie e-optimale pure ici). Donc dans 
le cas 1 (Hk+ i) est vraie. 

Cas 2 : m! = n. 

Soit g (resp. r) la stratégie du joueur 1 (resp. joueur 2) qui face à une histoire si- 
lencieuse, tire pour la première fois en date , et joue optimalement dès qu’une 

balle a été tirée. 

Si le joueur 1 tire pour la première fois avant m+ ^ +1 , soit à une date t = avec 

£ > 0, son paiement contre r est au plus g(t,r) = m j f .~ € +1 + ZXn+i < °- 
Si le joueur 1 tire pour la première fois en t > son paiement contre r est au 

plus g(t,T) = = 0. 

On a donc g(t , r) < 0 pour tout t, et par symétrie (cr, r) est un point-selle du jeu. 
(üT/c+i) est prouvée dans le cas 2. 

Cas 3 : m' < n. ... (similaire au cas 1). 

3.1) la fonction de paiement est la suivante : 


g(x,y) 


x + (1 - x)y(-l) 

= -(1 - x)y + x 

si 

X < y 

x(l — x) + x(l — x)( — 1) 

= 0 

si 

x = y 

(-l)y + (l-y)x 

= -(1 +x)y + x 

si 

x>y 


Si y > 0, jouer x juste avant y donne sup^, g(x, y) > y 2 . Et si y < 1, on a 
#(1,2/) = 1 — 2 y, donc inf î/ sup a ,^(a;,2/) > 0. Or le jeu est symétrique donc la valeur, si 
elle existe, ne peut être que zéro. Il n’y a pas de valeur en stratégie pures. 

3.2) Supposons maintenant que le joueur 1 ait une stratégie mixte a de de densité 
/ sur [a, 1], où a > 0 et / est différentiable, qui garantisse un paiement positif ou nul. 
Alors par symétrie, a garantit aussi 0 pour le joueur 2, et donc on s’attend à avoir : 
pour tout y > a, p(a, y) = 0 et donc : 


-y + (1 + y) [ xf(x)dx + (1 - y) f xf{x)dx = 0. 
J a J y 
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On dérive 2 fois et on trouve yf'(y) + 3 f(y) = 0. D’où Ton tire f(y) = Cy~ 3 l y > ai 
pour une constante C bien choisie. On reporte dans l’équation du dessus et on obtient 
C = 1/4, et a = 1/3. Il suffit alors de vérifier les calculs précédents. 

4) La fonction de paiement est la suivante : 


g(x,y) 


x — y + xy si x < y 
< 0 si x = y 

1 — 2 y si x > y 


Puis on vérifie que les stratégies données forment bien un point-selle. 

5) On ne peut pas raisonner par récurence dans le cadre d’un duel silencieux car 
une fois qu’une balle a été tirée, seul celui qui l’a tiré le sait. 


Exercice 2 : 

sup s inf t f(s,t) = -1, inf t sup s /(s,t) =0. 

On peut vérifier que / est quasi-concave en s et quasi-convexe et s.c.i. en t. Elle est 
aussi s.c.s. en s pour tout t sauf pour t = 1. 

Il existe une valeur en mixte (— \). Il suffit que le joueur 1 joue uniforme sur [0, 1] 
(ou joue 0 avec probabilité \ et 1 avec probabilité ^). 

Exercice 3 : 

1) On note v = inf n u n = lim n u n . Pour n tel que v n < v + 1/n, considé- 
rons t n une stratégie 1/n-optimale du joueur 2 dans G n . On a pour tout s de 5, 
f(s,t n ) < f n {s,t n ) <v n + 1/n < v + 2/n. On pose maintenant, pour tout n : 

A n = {s e 5, / n (s, t) > v - 1/n Vt G T}. 

A n est une suite décroissante de compacts non vide. Il existe donc un élément dans 
fl n A n , qui s’avère être une stratégie optimale pour le joueur 1 dans G. 

2) Dans les deux cas, pour tout n v n = 1 et v = 0. Dans le premier cas S n’est 
pas compact, dans le second ( f n ) n n’est pas monotone. 


Exercice 4 : 

1) Soit x = inf/ 3 çgsup aÇi 4 #(a, fi(a)). Soit fi e B quelconque, puisque 
inîbeB g(a,b) < g(a,fi(a)) on déduit que y<x. Inversement, puisque pour tout e > 0, 
et tout a, il existe fi{a) tel que : #(a, fi (a)) < inf &p(a, b) + e, on déduit que x < y. 

2) Il suffit de remarquer que les a constantes sont dans la classe des fonctions 
continues. 

3) C’est une conséquence de Brouwer. En effet, / l’application de A x B vers lui 
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jflême qui associe à (a, 6), /(a, b) = (a(6),/3(a)) est définie sur un convexe-compact. 
glle admet donc un point fixe (a*, b*). 

4) Soit a, e-optimale pour 2 = sup aG ^ r infb G £ g(a(6), b). 

Soit /3 e-optimal pour t = inf^ e ^sup aGi 4 ^(a, /3(a)). 

j Si (a*, b *) est un point fixe de / comme dans 3) alors x — e < g(a *, 6*) < y + e. 
Ceci est vrai pour tout e, d’où x < y. 

5) Le joueur 1 veut maximiser sa distance par rapport au joueur 2 et l’opposé 
} our le joueur 2. Donc y = 0 (le joueur 2 joue b = a), v = \ (le joueur 2 joue \ ce qui 
-end 1 indifférent entre réagir avec 0 ou 1). inf/3çg c sup aÇA g(a,/3(a)) = 0 (il suffit de 
îhoisir /3(a) = a). Enfin, sup aG ^ inf beB 9 {<x(b),b) = 0 (il suffit de prendre b un point 
ixe de a). 


Feuille 4 


Exercice 1 : 

On note E = E, 


'oyr* 


1) Soit n > 1 et h n dans Hn fixés. Que g n soit dans C ou pas, en date n+1 le joueur 
va joueur x n +i e A (/) tel que pour tout y , (x n +i Ay - U. c (g n ),gn ~ n c(Sn)) < 0. 
On a : 


H-l ^ ll#n+l ^c(gn)\\ ) 

^ Il St ~ nc{9n)\\ , 


< 


n + 


1 n _ _ 2 

ytën +1 - *c(gn)) + ~ ^c(9n))\\ , 


/ j \ 2 ✓ ^ \ 2 2 n 

< (^ï j lltfn+l - nc(gn)f + (^j- J d n 2 + — < 9n+l ~ 7Tc(Sn),Sn - K c(Sn) > 

Par hypothèse, l’espérance du produit scalaire ci-dessus est négatif, donc 

E (d 2 n+1 \h n ) < ^y^E (\\g n+1 - Mgn)f\h n ) + (y^y) V- 

2) E((g n+1 -Hc(gn),gn-^c{gn)) | hn) < 0, donc ^ (hn+l - ^c{g n )\\ 2 \h n ) < 

|(llWl-5n||>n)<(2P||oo) 2 . 

3) On a alors : 

E (d 2 n+1 \h n ) < (-^ i )V + (^ î ) 2 4||A||^ 


H 2 oo- 
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En prenant l’espérance, on obtient : Vn > 1, E (d^ +1 ) < (^j) 2 E(d n 2 ) -f 
(n+l) 2 ^ll-^Hoo- Donc on a par récurrence, pour tout n > 1, E(d^) < puis 

E(4) < 2J $t- 

4) On pose e n = dn+J2t ^ n + 1 L’inégalité (2) donne : E(e n+ i| h n ) < e n , donc 

(e n ) est une surmartingale positive dont l’espérance tend vers zéro. Donc e n — » n -xx> 0 
P< 7 |T P-s., et enfin d n — > n ->oo 0 P a>r p.s. 

Exercice 2 : 

1) Le théorème de Fubini ne s’applique pas. 

Exercice 3 : 

Soit fi la probabilité uniforme sur [0, 1/2]. La stratégie 1/3 /x + 2/3 6\ du joueur 
1 garantit 1/3. 

Soit cr dans A (S) qui garantit au moins 1/3. /(cr, t) > 1/3 VL 
t = 1 donne cr([0, l/2[) - cr(]l/2, 1[) > 1/3. 
t = \ donne — cr([0, l/2[) + cr([l/2, 1]) > 1/3. 

On somme les inégalités : cr({l/2}) +cr({l}) > 2/3. Comme cr([0, l/2[) > 1/3, on 
obtient : <r([0, l/2[) = 1/3 et cr({l/2}) + cr({l}) = 2/3. Donc f(cr,t = 1) = 1/3, et cr 
ne garantit pas plus que 1 /3. 

D’où sup CT inf r /(cr, r) = 1/3. 

Soit maintenant r dans A (T) telle que : inf s /(s,r) < 1/3 + e. 
s = 1 donne r({l}) > 2/3 — e. 

s = 0 donne r(]l/2, 1]) — r(]0, l/2[) < 1/3 + e, donc r(] 0, l/2[) > 2/3 — e — (1/3 + e) = 
1/3 - 2e. 

s = donne r({ 1}) - r([l/2, 1[) + r([ 0, l/2[) < 1/3 + e. 

Donc —1 + 2 t({ 1}) + 2r([0, l/2[) < 1/3 + e, et r({l}) + r([ 0, l/2[) < 2/3 + e/2. 

On obtient alors 1 — 3e < 2/3 + e/2, d’ o ù e > 2/21, et 1/3 + e > 3/7. Donc 
inf T sup a /(cr, r) > 3/7, et G n’a pas de valeur. 

Remarque : on peut montrer que inf r sup^ /(cr, r) = 3/7, avec r = 4/75i + 
2/7 *i/ 2 + l/75i/4* 

Feuille 5 


Exercice 1 : 

1) Premier jeu : 3 équilibres (if, D), (J5, G) et (2/3 H + 1/31?, 2/3 G + 1/3D). 
Second jeu : somme nulle, un équilibre (0, 7 H + 0, 31?, 1/2G + 1/2D). 
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Troisième jeu : (if, D) et une infinité d’équilibres ( xif + (1 — x)j B, G), avec 
*€[0,1/2]. 

Quatrième jeu : 3 équilibres (commencer par éliminer B et d qui sont strictement 
dominées dans l’extension mixte) 

Cinquième jeu : (j B,D, O), (if, G, E) et (l/2if+l/2if, 1/2G+1/2D, 1/20+1/2F). 

2) 1, -1/2 et 7/4. 

Exercice 2 : 

1) N = {l,...,n}, Si = R+ pour tout i, et <fc(pi, ...,p n ) = Ximax(l - J2j x j > °)- 

2) Soit x = (xi, x n ) un équilibre de Nash. Pour i dans iV, on note s* = ^2j^i x j 
et s = J2jXj- 

Supposons qu’il existe i tel que Si < 1. Alors Xi = (1 — S{)/2 car X* est BR contre 
X-i. Alors 5 < 1, et donc pour tout j on a s j < 1 et Xj = (1 — Sj)/ 2. D’ où Xj + s = 1 
pour tout j, donc x\ = ... =x n = l/(n + 1). On a bien un équilibre de Nash, le prix 
est p = l/(n + 1), la pêche totale est n/(n + 1) et le revenu total est n/(n + l) 2 . 

Sinon, Si > 1 pour tout i. On a d’autres équilibres de Nash, où le prix et les reve- 
nus sont nuis et la pêche est totale (Remarque : on a supposé des coûts de production 
nuis.) 

3) n/(n + l) 2 < 1/4 et n/(n + 1) > 1/2 pour tout n > 1. 

Exercice 3 : 

1) Dans l’extension mixte de G, le joueur 1 choisit une probabilité sur A 1 
qui peut se représenter par un élément a = pl + (1 — p)j y avec p G [0,1]. L’en- 
semble des stratégies mixtes du joueur 1 est alors vu comme l’intervalle complexe 
S 1 = [1, j] = {pl + (1 -p)h P € [0,1]}. De même, S 2 = [jj 2 ] et S 3 = [j 2 , 1]. Notons 
g 1 (a,b i c) le paiement espéré du joueur 1 lorsque a, b et c sont jouées, g 1 est affine en 
chaque variable, et coïncide avec les paiements de G lorsque les stratégies sont pures. 
Cette description caractérise g 1 , on a donc la même formule Re(abc). Idem pour g 2 , 
g 3 = 0 est clair. 

g 1 (a i b y c) = Re(abc ), p 2 (a,6,c) = Im(abc ), p 3 (a,6, c) = 0. 

2) non et non. Soit F C M 2 la projection des paiements réalisables sur les paie- 
ments des joueurs 1 et 2. F contient les segments [1, j], [j,j 2 \ et [j 2 , 1] mais comme 
|a6c| = |a||6||c| > 1/8 > 0 pour tout (a, 6, c) de S 1 x S 2 x 5 3 , 0 £ F. 

Exercice 4 : 

Al) Soit D = {di, ...,d n , ...} dénombrable dense dans Â. On définit = d\ et 
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a n = sup{a n _i,d n } pour tout n. On extrait une sous-suite (a,£( n )) n qui converge vers 
a G S. a majore D , donc aussi D, et alors a majore A. Et tout majorant P de A 
majore D , donc vérifie P >a n pour tout n, d’ où P > a. a = sup A. Pour A = S, on 
obtient sup S G 5 , donc S a un plus grand élément (idem pour inf A et min S). 

A 2 ) Posons A = {s G 5 , f(s) < s}. A ^ 0 , car A a un plus grand élément. Notons 
a = inf (A) G 5 , d’après la question Al. On a pour tout s de A, a < s donc comme / 
est croissante, f(a) < f(s) < s, d’où f(a) minore A , et /(a) < a. On utlise à nouveau 
la croissance de / : /(/(a)) < /(a), donc /(a) G A. Comme a minore A, a < /(a), et 
finalement a = f (a). 

Bl) Fixons i et S-*. Z?i?, z (s"*) est non vide et compact (car S 1, compact et g 1 s.c.s. 
en s*). C’est un treillis par surmodularité de g 1 . 

B 2 ) On suppose s~ % > s' -1 , et on considère t H G BR^(s , ~ i ). Il existe x i dans 
j B i?/(s _î ). On a : 0 > g i (x l V — g i (x i ^s~ i ) > g i (t ,i ,s~ i ) - g i (x i A t ,i ^s~ i ) > 

g^t' 1 , s'- 1 ) - g^x* A t f \ s '-*) > 0 . Donc on pose t* = x i V 

B 3 ) Pour tout dans S”*, on définit dans S 1 comme le plus grand élé- 

ment de j BR?(s~ t ) (voir Al). Puis on définit l’application (“de plus grande meilleure 
réponse") / de S = dans S par f(s) = ( . / est croissante par B 2 ), et a 
un point fixe par A 2 ). C’est un équilibre de Nash de G. 

C) Poser s 1 = q l et s 2 = — q 2 . Nouvelles fonctions de paiements : 161(51,52) = 
SijPi(si, s 2 ) - Ci(si), et t 6 2 (si,s 2 ) = -s 2 P 2 (si, -s 2 ) - C 2 (-s 2 ). On a du\/ds\ qui 
est croissante en s 2 , donc si si > 5 ^, et s 2 > s 2 : 


PS 1 rs 1 

/ diui{ti,s 2 )dt x > f diui(t u s' 2 )dti. 
J si J s\ 


D’où t6i(5i, s 2 ) — u\(s' ly s 2 ) > ui(si, s 2 ) — 161(51, s 2 ), et i6i a des différences croissantes 
en (51, s 2 ). Idem pour u 2 ( du 2 /ds 2 qui est croissante en si). On applique B 3 . 


Exercice 5 : 

Notons £1, £ 2 , £3, 2/1, i/ 2 les probabilités respectives de if, M, JB, G et D. 

- Si a < 0, la stratégie H est strictement dominée par 1/2 M + 1/2 B, donc les 


G D 


équilibres du jeu sont ceux de M 

B 

(x = (0, 1/2, 1/2), y = (1/2, 1/2)). 

- Si a = 0, le jeu est à somme nulle, les deux joueurs garantissent 0, donc la 
valeur est zéro, et les stratégies optimales sont y = (1/2, 1/2) pour le joueur 2 et 
£ = (1 — 2 a, a, a), avec a G [ 0 , 1 / 2 ] pour le joueur 1 . Les équilibres sont les couples 


1,-1 

-1,1 

-1,1 

1,-1 


. Il y a donc un seul équilibre 
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de stratégies optimales (x = (1 — 2a, a, a), y = (1/2, 1/2)) avec a G [0, 1/2]. 

- Supposons a > 0. Soit ( x = (£i,£2,£3), y = (2/1, 2/2)) un équilibre. Si X2 > £3, 
alors comme le joueur 2 est en meilleure réponse on a î/2 = 1 et comme le joueur 1 
est en meilleure réponse alors X2 = 0 , contradiction. De même £3 > £2 est impossible, 
donc on a forcément £3 = £2. Toute stratégie du joueur 2 contre x donne un paiement 
nul au joueur 2, donc celui-ci est en meilleure réponse contre x. Comme le paiement 
du joueur 1 à l’équilibre est au moins a et que a > 0 , on a £ 2 = £3 = 0 . Donc 
£ = (1,0,0), et il ne faut pas oublier d’écrire que x est en meilleure réponse contre y. 
C’est le cas si et seulement si : a > y\ — (1 — y\) = 2 y\ — 1, et a > 1 — 2 y\, c’est-à-dire 
si et seulement si : (1 — a )/2 < y\ < (1 + û')/2. 

Si a > 0, les équilibres sont donc les profils (x = (1,0,0), 2/ = (2/1, 2/2))» 
avec (1 — a )/2 < 2/1 < (1 + a)/ 2 . (Si a > 1, on a donc tous les profils 
(x = (1,0,0), y = (3/1, 3/2))) 

Exercice 6 : 

R-2 R'2 &2 

Ri ( (0,0,0) (0,1,0) \ / (0,0,1) (1,0,0) \ 

B 1 (1,0,0) (0,0,1) J ( (0,1,0) (0,0,0) J 

R3 

1) Les équilibres de Nash en stratégies pures sont obtenus quand 2 joueurs choi- 
sissent la même couleur, et le troisième l’autre couleur. Il y a donc 6 équilibres de 
Nash en stratégies pures. 

2) Notons £, y , 2 les probabilités respectives que les joueurs 1, 2 et 3 choisissent 
la couleur rouge. 

Calculons la meilleure réponse du J 3. En jouant i?3, son paiement est (l—x)(l—y), 
en jouant JB3 son paiement est xy. On a (1 — £)(1 — y) > xy ssi x + y < 1, donc : si 
x + y < 1, la meilleure réponse du joueur 3 est 2 = 1, si x + y > 1 la meilleure réponse 
du joueur 3 est z = 0, et si x + y = 1 tout 2 est meilleure réponse pour le J3. Par 
symétrie, on obtient les meilleures réponses des joueurs 1 et 2. 

Soit maintenant ( x,y,z ) un équilibre de Nash. On a 6 équilibres purs par 1. On 
se restreint donc aux cas où ( x , y , z) n’est pas pur. 

Supposons que deux joueurs au moins jouent une stratégie non pure, par exemple 
que £ e]0, 1[ et y g]0, 1[. Alors comme le joueur 1 est indifférent, on a y + 2 = 1. 
De même, £ + 2=1. Donc x = y = 1 — 2, et donc 2 g]0, 1[. Le joueur 3 aussi est 
indifférent, et donc x + y = 1. On obtient x = y = z = 1/2, et c’est bien un équilibre 
de Nash. 
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Le dernier cas à considérer est quand un seul joueur joue une stratégie non pure. 
Alors les deux autres joueurs, qui jouent des stratégies pures, ne choisissent pas la 
même couleur. On obtient alors une infinité d’équilibres : les profils où un joueur choi- 
sit Rouge avec probabilité 1, un joueur choisit Blanc avec probabilité 1, et le troisième 
joueur joue une stratégie mixte. 


Feuille 6 


Exercice 1 : 

1) Clairement, S(r) C S(a) étant donné g. 

Un élément i dans S (a) minimise Ylj Tj\\xi-yj\\ 2 - Or YtjTjWx-yjf = 
^2 j T j (\\x-z\\ 2 +\\z-y j \\ 2 + 2<x-z,z-y j >) = \\x - zf + 'EjTj\\z - yjf . Donc 
S(c r) C {i,#* minimise \\xi — z || 2 }. 

2.1) Soit (ctn,tn) équilibre de Gn • Par 1, on a que S(gn) c minimise 

\\xi — x;v_|_i|| 2 }. Comme d(x m ,xw+ 1) < 2e, on a pour i dans S(gn) : d(xi,xw+i) < 2e 
et donc d(xi,x*) < 3e. idem pour i dans S'(ryv), car S'(ryv) C S(gn). Comme xyv+i = 
YiLi TN{i)yu et que yt G F{xi) pour tout z, on a xn + i ^ Co{ U z F(z)\ z e B(x *, 3e)}. 

2.2) F est de graphe compact, donc F(B(x*, 3e)) est compact, et K e = de f 
Co{ U z F(z)\z G B(x*,3e) est compact. On a donc x* G K e , et ceci pour tout e > 0. 

Soit x dans C\ £> qK £ . Pour tout n, on peut (par Carathéodory) trouver zf , ..., 
dans jB(x*,l/n) et écrire x = avec z/f G F(z f) pour tout i. On extrait 

des sous-suites convergentes, et comme le graphe de F est fermé et que F(x*) est 
convexe, on trouve que x G F(x*). Et donc x* G F(x*). 

Exercice 2 : 

1.1) Soit g fixé dans £(77), pour tout i on définit 7(cr, t % ) comme le nombre de 
stratégies pures du joueur i strictement meilleures que t l contre cr”\ On définit alors 
r tel que pour tout joueur i et stratégie pure 

T ‘ (S ‘ ) = 

r est dans F (a). 

1.2) Les hypothèses de Kakutani s’appliquent à F. On obtient un point fixe a £ de 
F qui est un équilibre e-propre du jeu, et on peut considérer une valeur d’adhérence 
lorsque e — >■ 0. 

2) Jeu 1 : (T, L) est un équilibre propre donc parfait donc Nash. (£, B) est Nash 
mais pas parfait. Jeu 2 : (T, L) est propre donc parfait donc Nash, (M, M) est Nash, 
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parfait mais pas propre. 


Exercice 3 : 

1) Si t est un équilibre de Nash alors pour tout s et tout i, Gi(si , t-i) < Gi(t *, t-i). 
En sommant sur i on déduit que 4>(s,£) < $(£, t). Inversement, supposons que 
4>(s, t) < $(£,£), Vs G S. En prenons s de la forme (s^t-i) on déduit que G^s^t-i) < 
Gi(ti , t-i) pour tout i et Si : t est un équilibre de Nash. 

2) On veut montrer l’existence d’un équilibre de Nash. Par l’absurde, on suppose 
que pour chaque t il existe s avec 


$(M) > $(M). 

2.1) Considérons la famille ( O s = {t G S; <!>($,£) > ®(t,t)}) se s- Puisque Yn=i^i est 

continue, t -> est continue. Puisque Gi(s i,.) est continue sur S-i pour tout 

Si, pour chaque i, t — ► 4>(s,£) est continue. Par conséquent, t 4>(s,£) — $(£,£) est 
continue et donc O s = {t G 5; 4>(s,t) > <!>(£,£)} est ouvert pour tout s. Aussi par 
hypothèse, tout t est dans au moins un s. Nous avons bien un recouvrement de S par 
des ouverts. 

2.2) Puisque S est compact, il peut être recouvert par une famille finie {O s k} keK . 
Par conséquent, il existe (s k )keK avec : 

V£ G S , max$(s*,t) > 


2.3) Soit 0 définie par : 

1 ' £ fe ws fc . <) - *(*, t)) + t) - *(*, <)) + 

C’est une application bien définie car pour tout t, il existe k tel $(s k , t) > $(£, t) ce 
qui implique que - $(t,t)) + > 0- Aussi, l’image de t est une combinaison 

convexe des s fe . Puisque S est convexe (comme produit de convexes), &(t) est dans S. 
Enfin, la continuité de l’application t — » 4>(s, t) — $(£, t) assure que 0(£) est continue. 


Le théorème de Brouwer implique l’existence d’un point fixe t * de 0. 

2.4) Soit t* = 0(£*). Alors t * = J2keK^kS k avec = 


. Ainsi 


Xk > 0 implique 4>(s fe ,£*) > <!>(£*,£*). Puisque Gi(.,S-i) est concave sur S* pour tout 


S-i et chaque i, s -> 4>(s,t*) est concave en s (comme somme de fonctions concaves) 
et donc $(£*,£*) > ^ \k®(s k ,t*). Par conséquent, <!>(£*,£*) > $(£*,£*) : une contra- 
diction. 
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Exercice 4 : 

1) Puisque G est de potentiel 4>, nous avons par définition V 2 ,Vs\t 2 G S^Vs -2 G 

s-* 

G\s\ s “*) - G*(t\ s"*) = $(**, s"*) - *(t\ s"*), 
l’extension linéaire implique pour tout Vi, Vcr 2 ,r 2 G E 2 , Ver -2 G E “ 2 

G 2 (cr 2 , < 7 -2 ) - G 2 (r 2 , a~ i ) = $(<^,0 - $(t\Ô 
Fixons maintenant une r 2 € E 2 quelconque du joueur 2 et un profil de stratégies 
cr -2 quelconque des autres joueurs. Ainsi, 


gv.O = 

= *(a < ,a- < ) + /(r i >< r- < ) 

D’où cr 2 maximise G 2 (cr 2 , <r“ 2 ) si et seulement s’il maximise 4>(cr 2 , cr“ 2 ). Ainsi, a est 
un équilibre de Nash de G si et seulement il est pour 4>. Et puisque dans le jeu $ les 
joueurs ont la même fonction objective, si s G argmax tGl s<I>(£) alors c’est un équilibre 
de Nash pur de $ donc de G. 

2 ) Le jeu 


a i 

CL2 

est de potentiel car G 1 («) = G 2 (•) . 

Il a deux équilibre purs (ai, &i) et (a 2 , 62 ) et un équilibre mixte (^ai ® |û 2 ; ® § 62 ) 

(ainsi un jeu de potentiel peut avoir plusieurs équilibres). 

3) Dans le jeu de congestion on a d’un côté 

G\m , s' 1 ) - G\n , s“*) = u m (l + t m (a“*)) - u n (l + t n (Ô) 


61 62 


( 2 , 2 ) 

( 0 , 0 ) 

( 0 , 0 ) 

( 1 , 1 ) 


et de l’autre côté : 

o - *(«, o = E fc yZT - E fe E^r _<) «V) 

Puisque £ m (ra, s -2 ) = 1 + et pour ! / m on a £ m (Z, s -2 ) = £ m (s” 2 ) nous 

déduisons que, 


$(m,o-$(n,o = ^“W+E™ ; “ B(r )-K=r 

= E r=1 « w-E r=1 u 

= u m { 1 + t™(a“*)) - u n (l + t n (a _< )) 




■\t n (m,s *) 


’ \t 7 l (n,s *) n/< 


= E:r (s_,) - E^r* + E^r - e;i; 
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Le jeu de congestion est bien un jeu de potentiel. 

4) La dynamique du réplicateur est définie comme suit : 

*V)W = *V)W[GV,* -i (*)) - G*(*W)]- 

Puisque G est un jeu de potentiel, nous avons que pour tout s G S : 
G i (s i , s~ l ) - G\s) = - *(2) 


d’où 

[GW'*) - Gi (^)] = Ey^W [*(«*• O - ®(2)] 

et donc 

G\s\x-\i )) - G*(x(t)) = $(s\x-\t)) - *(®(t)) 

ainsi, 

**(»*)(*) = xVXOW**, *"*(*)) - *(*(*))]• 

Posons maintenant </>(t ) = 4>(:r(£)), d’où 

Ht) = j t [E s x ( s )(*) $ ( s )] 

= I[e„ (> . ,(n,'VK«))*(.)] 

- ,£*^'> 0 ]*,*v><<>)*(*> 

= E, E„«.*v><‘> E.-.„-, (H^xo) *<» 


Par ailleurs 

E^VX^^W) - *(x(*))]*(x(4)) 

= E.« €S . x V)w*(*s* _< (*)) - *(*(*))i*(x(t)) 

= [*(x(t)) - *(x(*))]*(x(t)) 


0 
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et donc 

*(**(*), *-«(*)) = £ si€Si *V)w*K, *-*(*)) 

= *"*(*)) - ®(*W)]®(« 1 ,*- < (*)) 

= E.« e **V)(<)[*(» 4 , *"*(*)) - *(*(*))] [«(**.*-*(«)) - *(*(*))] 
= E si € S <* V ) W [*( s ^ _ i w ) - *(*(*))] 2 

Conclusion : (j) est croissante et puisqu’elle est bornée, elle converge. Donc <j)(t) — » 0 
(sinon (j) divergerait). Cela implique que pour tout i et s z , #*($*) (£)[<I>(s z , £”*(£)) — 
$(x(*))] 2 -> 0. 

Deux cas sont maintenant à envisager : (1) si $(s\ x“ l (£)) — ®(x(t)) ne tend pas 
vers zéro à l’infini alors x l (s t )(t) — >• 0. et donc aussi x l (s l )(t) et (2) si <I>(s\ x _l (£)) — 
$(a;(£)) -* 0 alors 

*V)W = *“*(*)) - *(»(«))! -> 0 

Donc i: 1 — >> 0 impliquant que x(t) converge vers l’ensemble des points station- 
naires de la dynamique du réplicateur qui sont atteints de l’intérieur. C’est points 
sont nécessairement des équilibres de Nash du jeu. 

En effet, à la limite x t (s t )(oo)[$(s t i x~ l (oo)) — $(x(oo))] = 0, cela implique que : 

a) si s l est dans le support de x l (oo) (x l (s l )( oo) > 0) alors son paiement est in- 
dépendant de la stratégie du support x~ l (oo)) = <É>(x(oo)), 

b) si s 1 donne un paiement inférieur <I>(s z , x _î (oo)) < <3>(a;(oo)) alors x l (s‘ l )( oo) = 0, 

c) on ne peut pas avoir $(s\ x~ l (oo)) > <Ê>(x(oo)) pour une certaine stratégie s 1 car 
sinon cela implique que pour tout t grand x t (s l )(t) = x l (s l )(t)®(s' L , x~ l (t)) — ®(x(t)) > 

0 montrant que x l (s l )(oo) > 0 impliquant par (1) que <É>(s z ,x _l ( oo)) = $(x(oo)). 

5) Pour la dynamique de meilleure réponse nous avons : 


m = £ 4 #(**(*), *-*(*)) 

= ^ *(**(*) + ® < (*)-x < (0,*- , (t)) 
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par linéarité de $ et puisque x l {t) + x l (t) G MR. l [x *(£)] nous déduisons que : 

m = E* *(**(*) + **(<).*"*(«)) - «(**(*), 

= E, [*■*(*“*(*)) - *(*(*))] 

Puisque F l (x~ l (t)) — <I>(:r(£) > 0 , <j) est croissante et puisqu’elle est bornée, elle 
converge nécessairement. Donc — >■ 0, impliquant que pour tout i, $(x(t)) — > 
F l (x~ l (t)) = max s i G( 5 i^(s î ,x _l (t)). Ainsi, tout point d’accumulation x(oo) de cette 
dynamique est un point fixe de la correspondance de meilleure réponse et est donc un 
équilibre de Nash. 


Feuille 7 


Exercice 1 : 

1) Si le joueur 2 avait une stratégie gagnante, le joueur 1 pourrait l’imiter... For- 
mellement, le jeu est à information parfaite donc il a une valeur en stratégie pures, 
ce qui revient à dire ici que l’un des joueurs a une stratégie gagnante. Supposons par 
contradiction que le joueur 2 possède une stratégie gagnante dans le jeu, et considé- 
rons le premier coup (n,ra) (en haut à droite) du joueur 1, alors le joueur 2 a une 
réponse gagnante. Or si le joueur 1 joue au premier coup cette réponse du joueur 2 
il se retrouve dans la même position et donc lui-même dans une position gagnante, 
contradiction. Il est crucial de commencer par (n, m) car sinon il se pourrait que la 
situation après le coup du joueur 2 ne puisse pas être générée par le joueur 1. 
Remarque : Jouer (n,m) revient ici à passer son tour pour le joueur 1. 

2) Le joueur 1 commence par jouer la case (2,2). Il ne reste plus alors que des 
points sur les axes, formant deux côtés adjacents d’un carré... Chaque fois que le 
joueur 2 joue un point sur un axe, le joueur 1 joue le symétrique sur l’axe opposé, et 
ainsi de suite jusqu’à ce que le joueur 2 prenne (1, 1). 

3.1) Dans le cas m = oo et n = 2, c’est le joueur 2 qui a une stratégie gagnante. 
Si le joueur 1 commence par jouer (1 ,7/), on se retrouve dans le jeu G(2,y — 1) et le 
joueur 2 peut gagner. Si le joueur 1 commence par jouer (2,7/), le joueur 2 répond 
(1, y + 1) et ainsi de suite... 

3.2) dans le cas m = oo et n > 3, le joueur 1 peut gagner en ramenant le jeu à 
m = oo et n = 2 (jouer la case (3,1)). Dans le cas où n = m = oo, le joueur 1 peut 
gagner en commençant plus simplement par la case (2, 2) comme dans b). 
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Exercice 2 : 

Forme Normale : 


Forme extensive : 



M 

C 

(Mr, Mm) 

0 

1 

(Mr,C n ) 

1/2 

0 

(Cr, Mm) 

-3/2 

0 

(Cr,C n ) 

-1 

-1 


Nature 



La valeur est 1/3. Le joueur 1 a une unique stratégie optimale : 1/3 (Mr,Mn) + 
2/3 (MfaCjv) qui correspond à toujours miser si Rouge, et bluffer 1/3 du temps si 
Noir. Le joueur 2 a une unique stratégie optimale 2/3 M + 1/3C, qui correspond à 
aller voir le jeu de son adversaire 2/3 du temps. 

Exercice 3 : 

1) 2 joueurs, le joueur i fixe bi dans [0, +oo[. Son paiement est Vi — b-i si bi > &_*, 
—bi si bi < 6_i, et en cas d’égalité, le paiement du joueur 1 est v\ — &i, et celui du 
joueur 2 — &2- 

2) Il y a toujours un vainqueur et un perdant. Si 61 > 0 et 62 > 0, alors le perdant 
va payer sa mise qui est strictement positive, il a intérêt à miser 0. 

3) Si 61 = 0 et 62 = 0, alors l’un des deux a intérêt à miser n’importe quoi et 
remporter l’enchère, et payer 0 (enchère du perdant). 
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4) Si bi = 0 et bj > 0. Le joueur i va participer à l’enchère si son paiement devient 
strictement positif. Comme il devra payer 6^, son paiement sera strictement positif si 

Vi > bj. 

5) Si bi = 0 et bj > v alors le joueur j remporte l’enchère, et paye 0, aucune 
déviation profitable pour lui. Quant au perdant, s’il dévie, c’est pour gagner (car s’il 
reste perdant, il devra payer sa mise, mieux vaut miser 0). Mais pour gagner il faut 
miser plus que bj et donc plus que ce qui signifie avoir un paiement négatif ou nul. 
Pas de déviation profitable pour le perdant non plus. Tout point de cette forme est 
un équilibre de Nash, et ce sont les seuls d’après 2 et 4. Le gagnant peut être 1 ou 
2, donc pas nécessairement celui qui accorde le plus de valeur à l’objet, et il paye 0 
pour remporter l’objet. 


Exercice 4 : 

1 ) Utilité de l’acheteur [v — ( bi + 62) /2] lb 1 <b 2 du vendeur [(61 + 62 ) /2 — c ] 1 &i< 6 2 ' 

2 ) L’acheteur minimise 62 et le vendeur maximise 61 en gardant 61 < 62- A l’equi- 
libre 61 = 62. V6 G [c, v ] , b = b\ = b<i est un équilibre. 

3 ) Montrons que les bi(-) sont croissantes : 

On pose 7 Tb 2 (n) =E[[v- ( b x (c ) + b 2 )/ 2 ] l 6l (c)<&J • n 2 (v+e) = n b 2 (v)+eP(b 2 > &i(c)). 
Notons b 2 (y) = arg max 7 r b 2 (w). Alors n b ^ v )(v + e) = n b ^ v )(v) + eP(b 2 (v ) > 6 j(c)). En 


62 < &2(u), le premier terme est inférieur car on s’écarte de l’optimum, et le deuxième 
terme est inférieur car on a abaissé la borne. L’optimum de 62 — » tt& 2 (u + e) est 
nécessairement à droite de 62^)} c’est à dire b 2 (v + e) > b 2 (v). 

4) En supposant les fonctions d’enchères /?i, #2 strictement croissantes et C 1 , il 
faut commencer par écrire que pour chaque c, fii(c) maximise le paiement espéré : 

'Pi (c) + P 2 (v) 


f 1 / fll (c) +&(*>) _ \ 
J B- 1 ! Mc)) V 2 J 


dv 


La condition de premier ordre (en dérivant l’expression précédente par rapport à 
Pi(c)) donne : 

^(1 - p 2 l mc))) - i(c))(0!(c) - c) = 0 

Pour le joueur 2, P 2 (v) maximise le paiement espéré : 


rPi l (P2(v)) / 

L \ v 




-^1 + rf/3, - fo ( v )) = 0 


et la CPI donne 
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Les 2 CPI sont les 2 équations différentielles cherchées. Si on cherche des solutions 
linéaires, on reporte et on trouve 


et 




Il y a échange si v — c > 1/4. 

Remarque : cet exercice est à rapprocher du théorème de Myerson-Satterthwaite, 
au sens où l’enchère double n’est pas ex-post efficiente (il arrive qu’il n’y ait pas 
échange alors que v > c). 


Exercice 5 : 

1) On a les deux équilibres purs UL et DR, ainsi que l’équilibre complètement 
mixte x = y = 1/2, avec pour paiement (5/2, 5/2). 

2) Prenons le cas du joueur ligne. Si le résultat est PILE, il sait que le joueur 
colonne joue L, si bien que sa meilleure réponse est de jouer U, c’est ce que lui dicte la 
stratégie. De même, si le résultat est FACE, face à la décision R, la meilleure réponse 
est D. Il en va de même pour le joueur colonne. Le contrat est respecté. 

3) Le paiement d’équilibre est (3,3). Noter que le paiement a été amélioré. 

4) En fait, il est possible d’atteindre tout paiement compris dans l’enveloppe 
convexe des équilibres de Nash purs. Il suffit de considérer un pièce pour laquelle 
PILE apparaît avec probabilité p, pour p G [0, 1]. 

5) Nous allons faire l’étude pour le joueur ligne, il en va de même pour le joueur 
colonne. Si {A} est observé, le joueur colonne va jouer L, il est donc optimal de joueur 
U et c’est ce que prescrit l’accord. Si {B,C} est observé, le joueur ligne sait que la 
variable aléatoire vaut B ou C. La probabilité de chacune de ces possibilité est 1/2. Si 
c’est B, alors le joueur colonne joue L et si c’est C, il joue R (chacune de ces stratégies 
est jouée avec probabilité 1/2). Le joueur ligne est donc face au jeu : 


U 
D 

Il est donc indifférent entre U et D, et il n’y a donc pas de déviation profitable 
par rapport à l’accord qui lui prescrit de jouer D. 

6) Les trois issues possibles et équiprobables sont : A (UL), B (DL) et C (DR). Le 
paiement espéré est donc : (3 + 1/3, 3 + 1/3). Ce paiement n’est pas une combinaison 


1/2L+1/2R 

5/2 

5/2 
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convexe de (5, 1) et (1,5). Il n’appartient pas à l’enveloppe convexe des équilibres de 
Nash purs. Noter que le paiement a encore été amélioré. 

Exercice 6 : 

1) Le joueur 1 garde tout et offre x = 0 à l’autre joueur. En effet, puisque l’autre 
joueur accepte toute offre x > 0, l’unique meilleure réponse du joueur 1 est de tout 
garder. 

2) Soit a n (s) le paiement M’équilibre sous jeu parfait du joueur qui commence 
dans le jeu de somme initiale s qui dure n étapes (on peut montrer par récurrence 
que l’équilibre sous-jeu parfait est unique et donc que a n (s) est bien défini). C’est une 
fonction homogène en s. On a vu que ai (s) = s pour tout s > 0. Aussi, à l’équilibre 
on devrait avoir a2(100) = 100 — ai (50) : cette équation veut dire que le joueur 1 (qui 
commence) doit offrir au joueur 2 ce qu’il peut obtenir par lui même après (sinon celui- 
ci refuse). Ainsi a 3 (100) = 100-a 2 (50) = 100-a 2 (0.5 x 100) = 100-0.5a 2 (100) = 75. 
Donc, a n (100) = 100 — 0.5 a n _i(100). On déduit donc que a n (100) converge vers la 
solution de a = 100 - 0.5 a soit, 

3) Il assez facile de prouver que c’est un équilibre sous jeu parfait, montrons 
l’unicité. Notons A(s) C M 2 l’ensemble des paiements d’équilibre sous-jeux parfait 
lorsque le joueur 1 commence à proposer et que la somme vaut s, notons â(s) 
(resp. a(s)) le supremum (resp. l’infimum) des premières coordonnées de A(s). On 
a 0 < a(s) < â(s) < s, et â(s) > s/( 1 + 5). Dans un équilibre sous-jeu parfait, si à 
la première étape le joueur 1 propose un partage (£s, (1 — t)s) pour une proportion 
t G [0, 1], le joueur 2 acceptera si (1 — t)s > â(sô) y soit t < 1 — â(sô)/s> et refusera 
si (1 — t)s < a(sô) y soit pour t > 1 — a(sô)/s. Le joueur 1 gagnera donc au moins 
s(l — â(sô)/s ), donc 

a(s) > s — â(sô). 

De même, dans un équilibre sous-jeu parfait, le joueur 1 gagnera au plus s(l — a(s5) /s) 
si le joueur 2 accepte la proposition d’étape 1, et si le joueur 2 refuse la proposition 
d’étape 1 c’est pire pour le joueur 1 (qui ne peut alors espérer au plus que sô — a(sô) 
en acceptant à l’étape 2 la proposition du joueur 2). Bref, on obtient : 

â(s) < s — a(sô). 

En combinant les 2 inégalités, on trouve â(s) < s — (sô —â(sS 2 )) < s(l— Æ)+sÆ 2 (l — 
Æ)+â(sÆ 4 ) < .... < s/(l+ô). Donc â(s) = s/(l+ô). Et du coup a(s) > s - (sô) / (1 -h ô ), 
on obtient a(s) = â(s) = s/(l + Æ), le paiement d’équilibre sous-jeu parfait du joueur 1 
est unique. On en déduit que dans tout équilibre sous-jeu parfait le joueur 1 proposera 
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la proportion t = 1/(1 + J), soit le partage (s/(l + Æ),Æs/(l + 5)) à la première étape, 
et le joueur 2 acceptera. 

Remarque : par rapport à 2), noter que si S = 1/2, alors 1/(1 + ô) = 2/3. 
Exercice 7 : 

1) Soit a un équilibre en stratégies pures de G. Montrons que a est aussi un 
équilibre dans G'. Puisque a est pure, il recommande un unique choix dans chaque 
ensemble d’information et engendre une unique partie. Pour vérifier que a est un 
équilibre dans G', il suffit de tester que dans tout ensemble d’information atteint par 
cr, aucun joueur n’a intérêt à dévier. Soit V un ensemble d’information dans G' coupé 
par cr. Si le joueur qui y joue a une déviation profitable, elle le serait aussi dans G, 
une contradiction. 

2) Ce résultat est faux si cr est mixte. Il suffit de considérer le jeu à somme nulle 
Pile et Face sous forme extensive. Le joueur I commence et a le choix entre Pile et 
Face, puis, sans connaître le choix de J 1 , le joueur 2 a le choix entre Pile et Face. 
Si le joueur 2 a bien deviné le choix de Jl, J1 lui paye 1, sinon J2 paye 1 à Jl. 
L’unique équilibre est mixte. Le joueur 1 joue (1/2P, 1/2F) à l’étape 1 et de même 
pour le joueur 2 à l’étape 2. Si le joueur 2 connaît le choix de Jl, sa meilleure réponse 
change : s’il observe P il joue P, s’il observe F il joue F. 

3) C’est faux s’il y a le joueur hasard. Il suffit de reprendre l’exemple précédent 
en supposant que le joueur 1 est le joueur hasard et qu’il joue selon la distribution 
(3/4P, 1/4F). Le joueur 2 gagne 1 s’il devine la pièce et perd 1 sinon. Sa meilleure 
réponse s’il ne connait pas le choix de la chance est la stratégie pure P (car P a plus de 
chance de se réaliser). S’il connaît le résultat de la chance avant de jouer, sa meilleure 
réponse est de répliquer comme dans 2). 

Exercice 8 : 

1) Analysons ce jeu en partant de la fin du jeu (induction amont). 

S’il y a seulement un, deux ou trois jetons, le joueur qui s’apprête à jouer gagne en 
prenant tous les jetons restants. 

S’il reste quatre jetons, alors le joueur qui va jouer peut laisser un, deux ou trois 
jetons, et son adversaire sera capable de gagner, il aura une stratégie gagnante. Avec 
5, 6 ou 7 jetons restants, le joueur qui s’apprête à jouer peut gagner en amenant le 
jeu à la position précédente, c’est-à-dire 4 jetons restants. Avec 8 jetons, le joueur 
qui s’apprête à jouer peut laisser 5, 6 ou 7 jetons, et donc il donne à son adversaire 
l’occasion de gagner. Nous voyons donc que les positions avec 0, 4, 8, 12, ... jetons 
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sont des cibles ; si un joueur arrive à attendre un multiple de 4, il a une stratégie 
gagnante. 

Considérons maintenant le jeu avec 21 jetons. 21 n’est pas divisible par 4, le pre- 
mier joueur peut donc gagner. Son action “gagnante” au premier stade du jeu est 
d’ôter un jeton et d’en laisser donc 20. A partir de là il contrôle le jeu car il peut 
laisser à chaque fois un multiple de 4 à son adversaire. 

Sa stratégie optimale est unique car si jamais à un moment donné il ne laisse pas un 
multiple de 4 à son adversaire alors ce dernier a une stratégie gagnante. 

2) Quelque soit le nombre initial de jetons n, si n est non divisible par 4, le joueur 
I a une stratégie gagnante, sinon c’est le joueur 2 qui gagne. 

Exercice 9 : 

2 ) 

E D 
RR 
R.S 
SR 
SS 

3) SR et SS sont strictement dominées. L’équilibre qui reste est complètement 
mixte (1/2, 1/2) pour chacun des joueurs. 


2,2 

4,0 

4,0 

2,2 

-2,6 

2,2 

0,4 

0,4 


Feuille 8 


Exercice 1 : 

1) Forme Normale : 



(N n ,N b) 

(N n ,B b ) 

(B n ,N b ) 

(Bn, B b) 

N 

(2,2) 

(2,2) 

(5/2, 5/2) 

(5/2, 5/2) 

B 

(5/2, 5/2) 

(2,2) 

(5/2, 5/2) 

(2,2) 


Tout équilibre donne au joueur 2 le paiement 5/2, donc aux deux joueurs le paiement 
(5/2, 5/2). 
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2) Forme Normale : 



(N n ,N b ) 

(N n ,B b ) 

(B n> N b ) 

(Bn, B b) 

( N n ,N b ) 

(2,2) 

(2,2) 

(5/2, 5/2) 

(5/2, 5/2) 

( N n ,B b ) 

(7/2,1) 

(2,2) 

(5,0) 

(7/2,1) 

( B n ,N b ) 

(1,7/2) 

(2,2) 

(0,5) 

(1,7/2) 

(Bn, B b) 

(5/2, 5/2) 

(2,2) 

(5/2, 5/2) 

(2,2) 


Dans tout équilibre pur ou mixte le joueur 2 jouera (iVW, B b) y donc l’unique paiement 
d’équilibre est (2,2). 

3) Lorsque les 2 joueurs sont informés, le seul paiement d’équilibre est (2,2). 
Lorsque seul le joueur 2 est informé, le seul paiement d’équilibre est (1,7/2). 

4) La meilleure variante est la première, on peut donc dire que la valeur de l’in- 
formation est négative ici (mais soulignons le fait que dans ces modèles, à chaque fois 
qu’un joueur est plus informé, l’autre joueur le sait). 

Exercice 2 : 

2) La forme normale du jeu est la suivante : 


Ga G a G a Ma Ma Ma Da B a Da 


Ai 
A 2 
A 1 
B 2 

B 1 
A 2 
B 1 
B 2 


Gb Mb Db Gb Mb Db Gb Mb Db 


(0,3) 

(0,3) 

(0,3) 

(2,5) 

(2,5) 

(2,5) 

(1,6). 

(1,6) 

(1,6). 

(0,3) 

(1,11/2) 

(1,9). 

(1,5/2) 

(2,5) 

(2, 17/2) 

(0,0) 

(1,5/2) 

(1,6) 

(0,3) 

(1,5/2) 

(0,0) 

(2,5) 

(2,5) 

(2, 17/2) 

(1,9). 

(2,17/2) 

(1,6) 

(0,3) 

(2,5) 

(1,6). 

(0,3) 

(2,5) 

(1,6) 

(0,3) 

(2,5) 

(1,6). 


Les équilibres de Nash purs sont indiqués d’une étoile. Ils donnent tous un paie- 
ment de 1) au joueur 1. Les équilibres où le joueur 1 joue (Ai, A 2 ) ou (#i,i? 2 ) sont 
dits non révélateurs, car le joueur 1 envoie le même message quel que soit l’état, et 
donc ne révèle rien au joueur 2 sur celui-ci. Par contre, les équilibres où le joueur 
1 joue (Ai, B 2 ) ou (Si, A 2 ) sont dits complètement révélateurs car le joueur 2 peut 
déduire l’état du message du joueur 1. 

Remarque : Dans ce type de jeu sender-receiver, il existe toujours un équilibre 
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non révélateur, mais pas forcément d’équilibre complètement révélateur. Les équi- 
libres complètement révélateurs, quand ils existent, donnent les meilleurs paiements 
au joueur 2. 

3) Le couple de stratégies suggérées correspond à l’équilibre mixte (l/2(Ai, A2) + 
l/2(Ai,i?2)> (Ma,Db))- Son paiement est (2,27/4), donc le paiement de joueur 1 est 
meilleur qu’aux équilibres purs. Dans cet équilibre, le joueur 2 apprend l’état s’il ob- 
serve le message B mais pas s’il observe le signal A (sa croyance sur l’état passe alors 
de 1/2 A + 1/2 B à 2/3 A + 1/3B, on parle de révélation partielle d’information). Ici 
le joueur 1 a intérêt à révéler partiellement son information plutôt que complètement 
ou pas du tout. 

Exercice 3 : 

A) Par contradiction, soit ((aq,^ £3), (2/1? 2/2, 2/3)) un équilibre de Nash mixte. Si 
yi > 0, alors x\ = 0 et donc 2/3 = 0. Si de plus 2/2 > 0, alors X2 = 1 = 2/i> d’où une 
contradiction. Donc dans tout équilibre de Nash 2/1 = 0, et donc £3 = 0. Si X2 > 0, 
2/2 = 1 non. Si X2 = 0, on a x\ = 1 et on trouve aussi une contradiction. 

Bl) On ne peut avoir d’équilibre de Nash pur (s*)*, car que vaudrait 

B2) Par contradiction, soit un équilibre de Nash mixte induisant les variables 
aléatoires indépendantes si, s n ,... Par le lemme de Borel-Cantelli, la probabilité 
que Y^i s i = 00 est 0 ou 1. Les 2 cas sont impossibles. 

B3) Soit i un joueur, notons Si sa recommandation. Un rapide calcul montre que 
PiVilsi = 1) = P{p>2\si = 1) = P(Vi\si = 0) = P(/i 2 |si = 0) = 1/2, donc le joueur i 
est indifférent entre ses 2 actions et donc en meilleure réponse dans tous les cas. 


Exercice 4 : 

1 ) C’est un jeu à somme nulle fini. 

2 ) Si Q e A (S) est une stratégie du joueur 1 qui garantit 0 dans T, alors Q est 
une distribution d’équilibre corrélé de G. 

3) On a 


7 (m.tt) = 


(«'.s^es^s 2 ' 


V(« 2 ) J2 i=1>2 H (ti(Ui)€Li A*. À7((s X , s 2 )-,t\ u*). 
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Notons A\ le terme correspondant à % = 1. 

Al = 53.i .2 m x ( s1 )m 2 ( s2 ) 53m n 7r ( fl > w 1 )7((s 1 ) s 2 ) ; «*) 

= 53 s i ^(s 1 ) J2 U 1 n ( sl > ul ) ]C S 2 A* 2 (» 2 )'r((* 1 . s 2 ); s 1 , w 1 ) 

= 53 s i M V) 53 u i #s i V> “*) 53 s 2 V. s 2 ) - </ V, s 2 )) 

= 53,i **V) 53 u i pH® 1 » u1 )(5 1 (s 1 . m 2 ) - g\u\ n 2 )) 

= 53 1 1 m 1 (sV(s 1 .«w,m 2 )-53 i 1 / jl ( s V( sl i“ 1 )5 1 (« 1 ./‘ 2 ) 

= 53imV)5V.m 2 )-E mV)$V>m 2 ) 

'S 1 'Ui 

= ^(mSm 2 ) -^(mSm 2 ) = 0 

De même A2 = 0, donc 7(/i, 7r) = 0. 

4) V7T G A(L), 3/i G A(5) t.q. 7(/i, n) > 0, donc la valeur de T est positive et on 
peut appliquer a) et b). 

5) Dans le jeu auxiliaire à somme nulle T, l’espace de stratégies du joueur 1 est 
S = S 1 x S 2 x ... x 5 n , celui du joueur 2 est U£ =1 (S' 1 x S 2 ), et les paiements sont 
similaires. 

Exercice 5 : 

1.1) Soit 7 r une DEC. On a : 

G\n) = £ s i es i £ s 2 es2 GV» s 2 )tt(s\ s 2 ) 

= Es'es 1 max t^s i £ S 2 6 S2 G\t\ s 2 )n(s 1 , s 2 ) 

= £ s igsi ^(s 1 ) max t i eS i G\t\ ^(-Is 1 )). 

Or max t i € 5iG 1 (t 1 ,7r(.|s 1 )) > v pour tout s 1 , et donc G 1 (tt) > v. Par symétrie, on 
a aussi G 2 (tt) > — u, et comme G l (n) = — G 2 ( 7r), le paiement (G 1 (7r), G 2 (7 t)) vaut 
(v,-v). 

1.2) Soit 7 r une DEC de A, et s 1 une stratégie pure du joueur 1 qui a une proba- 
bilité strictement positive sous 7r. 

On au = G 1 (7r) = X) s i e si ^(s 1 ) max t i € si G 1 ^ 1 , tt^s 1 )), avec max^^i G 1 ^ 1 , »(V)) > 
v pour tout s 1 . Donc si 7r(s 1 ) > 0, on a max t i € £i G 1 (t 1 ,7r(.|s 1 )) = u, ce qui signifie 
que 7r(.|s 1 ) est une stratégie optimale du J2 dans A. 

2.1) Si le joueur 1 reçoit le signal ai, sa probabilité conditionnelle sur le signal du 
joueur 2 est 7r(.|ai) = l/26i + 1 /2&2» et jouer ai est bien une meilleure réponse contre 
l/26i + I/262. Si le joueur 1 reçoit le signal a< 2, il en déduit que le signal du joueur 2 
est 61, et jouer a 2 est bien une meilleure réponse contre 61. Par symétrie, le joueur 2 
aussi a intérêt à jouer le signal qui lui est recommandé, et la distribution indiquée est 
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bien une DEC. 

2.2) Une probabilité produit 7 r doit vérifier : 7r(ai, &i)7r(a2, 62) = 7r(ai, b2)n(a2> 61). 
Or ce n’est pas le cas ici, donc la réponse est non. 

2.3) Il est facile de voir que la valeur est ici 0, et que les stratégies optimales des 
joueurs sont : aa\ + (1 — a)a2, avec a > 1/2 pour le joueur 1, et symétriquement 
flbi + (1 — P)b2, avec P > 1/2 pour le joueur 2. Soit maintenant ir une DEC dans ce 
jeu. 

Pour toute action a du joueur 1, si 7r(a) > 0 on a, par la question 1.2) , 7r(6 3 |a) = 0 
et 7r(&i|a) > irfolay 

Donc 7 t(6 3 ) = 0, et par symétrie 7r(a 3 ) = 0. n s’écrit alors : 



b i 

b 2 

63 

ai 

X 

y 

0 

Ü 2 

z 

t 

0 

^3 

0 

0 

“F 


avec x > y, z > £, x > z et y > t. 

Réciproquement, on vérifie que toute distribution du type ci-dessus est une DEC. 
Exercice 6 : 

1) Les équilibres de Nash sont a = ( H , G), P = (B, D) et 7 = \G+\D). 

2.1) Les paiements des joueurs 1 et 2 ne dépendent pas de ce que fait le joueur 3. 
Si J 1 et J 2 jouent selon a ou P , le joueur 3 n’a pas de suprémum (il devrait jouer à 
l’infini). J1 et J2 jouent donc selon 7, mais le même problème se pose (la matrice du 
milieu lui donne 4 en moyenne et les deux autres peuvent lui rapporter strictement 
plus). 

2.2) Si on demande au joueur 3 de joueur au milieu et, aux joueurs 1 et 2 de se 
corréler en jouant avec probabilité \ sur ( H , G) et probabilité \ sur (B, D ) alors le 
gain du joueur 3 s’il jouent à droite ou à gauche est moins de | alors qu’en jouant 
2 = 0 il gagne 2. C’est un équilibre corrélé. 





Bibliographie 


[1] Aumann R. J. (1964) Mixed and behaviour strategies in infinité extensive games, in Advances in 
Game Theory , Dresher M., L.S. Shapley and A.W. Tucker (eds.), Annals of Mat hématies Study, 
52 , Princeton University Press, 627-650. 

[2] Aumann R. J. (1974) Subjectivity and corrélation in randomized strategies, Journal of Mathe- 
matical Economies , 1, 67-96. 

[3] Aumann R. J. (1990) Nash equilibria are not self-enforcing, in Economie Decision Making : 
Games, Econometrics and Optimisation (Essays in Honor of J. Dreze), Gabszewicz J.- J., 
J.-F. Richard, and L. Wolsey (eds.), Elsevier, 201-206. 

[4] Aumann R. J. (1995) Backward induction and common knowledge of rationality, Games and 
Economie Behavior , 8, 6-19. 

[5] Aumann R.J. (1998) On the centipede game, Games and Economie Behavior , 23 , 97-105. 

[6] Aumann R.J. and S. Hart (eds.) (1992) Handbook of Game Theory , Vol. 1, North-Holland. 

[7] Aumann R.J. and S. Hart (eds.) (1994) Handbook of Game Theory , Vol. 2, North-Holland. 

[8] Aumann R.J. and S. Hart (eds.) (2002) Handbook of Game Theory , Vol. 3, North-Holland. 

[9] Aumann R.J. and M. Maschler (1972) Some thoughts on the minmax principle, Management 
Science , 18 , 53-63. 

[10] Aumann R.J. and M. Maschler (1995) Repeated Games with Incomplète Information , M.I.T. 
Press. 

[11] Aumann R.J. and L.S. Shapley (1994) Long-term compétition — A game theoretic analysis, in 
Essays on Game Theory in Honor of M. Maschler , N. Megiddo (ed.), Springer, 1-15. 

[12] Aumann R.J. and S. Sorin (1989) Coopération and bounded recall, Games and Economie Be- 
havior , 1, 5-39. 

[13] Ba§ar T. and G. J. Olsder (1999) Dynamic N oncooperative Game Theory , Classics in Applied 
Mathematics, 23, SIAM. 

[14] Benedetti R. and J.- J. Risler (1990) Real Algebraic and Semi-Algebraic Sets , Hermann. 

[15] Benoit J. -P. and V. Krishna (1985) Finitely repeated games, Econometrica , 53, 905-922. 

[16] Benoit J. -P. and V. Krishna (1987) Nash equilibria of finitely repeated games, International 
Journal of Game Theory , 16 , 197-204. 

[17] Berge C. (1966) Espaces Topologiques, Fonctions Multivoques , Dunod. 

[18] Bernheim D. (1984) Rationalizable strategie behavior, Econometrica , 52 , 1007-28. 

[19] Billingsley P. (1999) Convergence of Probability Measures , Wiley. 


169 



170 


Chapitre 9. Bibliographie 


[20] Blackwell D. (1956) An analog of the minmax theorem for vector payoffs. Pacific Journal of 
Mathematics , 6, 1-8. 

[21] Blackwell D. and T. Ferguson (1968) The Big Match, Annals of Mathematical Statistics , 33 , 
882-886. 

[22] Border K.C. (1999) Fixed Point Theorems with Applications to Economies and Game Theory , 
Cambridge University Press. 

[23] Brouwer L. E. J. (1910) Uber Abbildung von Mannigfaltikeiten, Mathematische Annalen, 71 , 
97-115. 

[24] Brown G.W. (1951) Itérative solutions of games by fictitious play, in Activity Analysis of Pro- 
duction and Allocation , T.C. Koopmans (ed.), Wiley, 374-376. 

[25] Cesa-Bianchi N. and G. Lugosi (2006) Prédiction, Leaming and Games , Cambridge University 
Press. 

[26] Chen X. and X. Deng (2006) Settling the Complexity of Two-Player Nash Equilibrium, FOCS, 
261-272. 

[27] Demichelis S. and F. Germano (2000) On the indices of zéros of Nash fields, Journal of Economie 
Theory , 92 , 192-217. 

[28] Demichelis S. and F. Germano (2002) On knots and dynamics in games, Games and Economie 
Behavior , 41 , 46-60. 

[29] Demichelis S. and K. Ritzberger (2003) From evolutionary to strategie stability, Journal of 
Economie Theory, 113 , 51-75. 

[30] Dresher M. (1961) Games of Strategy , Prentice-Hall. 

[31] Dresher M., L.S. Shapley and A. W. Tucker (eds.) (1964) Advances in Game Theory , Annals of 
Mathematical Studies, 52, Princeton University Press. 

[32] Dresher M., A.W. Tucker and P. Wofe (eds.) (1957) Contributions to the Theory of Games , III , 
Annals of Mathematics Studies, 39, Princeton University Press. 

[33] Fan K. (1952) Fixed-points and minmax theorems in locally convex topological linear spaces, 
Proceedings of the National Academy of Sciences of the U. S. A, 38 , 121-126. 

[34] Fan K. (1953) Minimax Theorems, Proceedings of the National Academy of Sciences of the 
U. S. A, 39 , 42-47. 

[35] Forges F. (1986) An approach to communication equilibria, Econometrica , 54 , 1375-1385. 

[36] Forges F. (1990) Universal mechanisms, Econometrica , 58 , 1341-1364. 

[37] Forges F. (1992) Repeated games of incomplète information : non-zero sum, in Handbook of 
Game Theory , Vol. 1, Aumann R. J. and S. Hart (eds.), North Holland, 155-177. 

[38] Forges F., J.-F. Mertens and A. Neyman (1986) A counterexample to the Folk theorem with 
discounting, Economie Letters , 20, 7. 

[39] Forges F., J. Renault, S. Sorin and N. Vieille (2006) Théorie des jeux : le prix Nobel pour les 
travaux de R.J. Aumann, MATAPLI , 79, 47-70. 

[40] Fudenberg D. and E. Maskin (1986) The Folk theorem in repeated games with discounting or 
with incomplète information, Econometrica , 54 , 533-554. 



[41] Fudenberg D. and E. Maskin (1991) On the dispensability of public randomization in discounted 
repeated games, Journal of Economie Theory , 53, 428-438. 

[42] Fudenberg D. and J. Tirole (1991) Perfect Bayesian equilibrium and sequential equilibrium, 
Journal of Economie Theory , 53 , 236-260. 

[43] Gale D. and L.S. Shapley (1962) College admissions and the stability of marriage, American 
Mathematical Monthly , 69 , 9-15. 

[44] Gale D. and F.M. Stewart (1953) Infinité games with perfect information, in Contributions to 
the Theory of Games, II, Kuhn H.W. and A.W. Tucker (eds.), Annals of Mathematical Study, 
28 , Princeton University Press, 245-266. 

[45] Gilboa I. and A. Matsui (1991) Social stability and equilibrium, Econometrica , 58 , 859-67. 

[46] Giraud G. (2009) La Théorie des Jeux , Flammarion. 

[47] Glicksberg I. (1952) A further generalization of the Kakutani fixed point theorem, with ap- 
plications to Nash equilibrium points, Proceedings of the American Mathematical Society , 3 , 
170-174. 

[48] Gossner O. (1995) The Folk theorem for finitely repeated games with mixed strategies, Inter- 
national Journal of Game Theory, 24 , 95-107. 

[49] Gossner O. and T. Tomala (2007) Secret corrélation in repeated games with imperfect monito- 
ring. Mathematics of Operations Research, 32 , 413-424. 

[50] Govindan S. and R. Wilson (1997) Equivalence and invariance of the index and degree of Nash 
equilibria, Games and Economie Behavior, 21 , 56-61. 

[51] Guérrien B. (2010) La Théorie des Jeux , Economica. 

[52] Gui F., D. Pearce and E. Stachetti (1993) A bound on the proportion of pure strategy equilibria 
in generic games, Mathematics of Operations Research, 18 , 548- 552. 

[53] Hammerstein P. and R. Selten (1994) Game theory and evolutionary biology, in Handbook of 
Game Theory, Vol. 2, Aumann R. J. and S. Hart (eds.), North Holland, 929-993. 

[54] Harris C. (1998) On the rate of convergence of continuous time fictitious play, Games and 
Economie Behavior , 22, 238-259. 

[55] Harsanyi J. (1967-68) Games with incomplète information played by ‘Bayesian’ players, parts 
I-III, Management Science , 8, 159-182, 320-334, 486-502. 

[56] Harsanyi J. (1973a) Games with randomly disturbed payoffs : a new rationale for mixed strategy 
equilibrium points, International Journal of Game Theory, 2, 1-23. 

[57] Harsanyi J. (1973b) Oddness of the number of equilibrium points : a new proof, International 
Journal of Game Theory, 2 , 235-250. 

[58] Hart S. (1985) Nonzero-sum two-person repeated games with incomplète information, Mathe- 
matics of Operations Research, 10 , 117-153. 

[59] Hart S. (2005) Adaptive heuristics, Econometrica, 73 , 1401-1430. 

[60] Hart S. and D. Schmeidler (1989) Existence of correlated equilibria, Mathematics of Operations 
Research, 14 , 18-25. 

[61] Hillas J. and E. Kohlberg (2002) Foundations of strategie equilbrium, in Handbook of Game 
Theory , Vol. 3, Aumann R. J. and S. Hart (eds.), North Holland, 1595-1663. 



172 


Chapitre 9. Bibliographie 


[62] Hofbauer J. and K. Sigmund (1998) Evolutionary G âmes and Population Dynamics , Cambridge 
University Press. 

[63] Hofbauer J. and S. Sorin (2006) Best response dynamics for continuous zero-sum games, Discrète 
and Continuous Dynamical Systems- sériés B, 6, 215-224. 

[64] Kamien M., Y. Tauman and S. Zamir (1990) On the value of information in a strategie conflict, 
Games and Economie Behavior , 2 , 129-153. 

[65] Kakutani S. (1941) A generalization of Brouwer’s fixed point theorem, Duke Mathematical Jour- 
nal, , 8, 416-427. 

[66] Kohlberg E. and J.-F. Mertens (1986). On the strategie stability of equilibria, Econometrica , 54 , 
1003-37. 

[67] Kreps D. and J. Sobel (1998) Signalling, in Handbook of Game Theory , Vol. 2, Aumann R.J. 
and S. Hart (eds.), North Holland, 849-867. 

[68] Kreps D. and R. Wilson (1982) Sequential equilibria, Econometrica , 50, 863-94. 

[69] Kuhn H.W. (1953) Extensive games and the problem of information, in Contributions to the 
Theory of Games, //, H.W. Kuhn and A.W. Tucker (eds.), Annals of Mathematical Studies, 28, 
Princeton University Press, 193-216. 

[70] Kuhn H.W. and A. W. Tucker (eds.) (1950) Contributions to the Theory of Games, /, Annals 
of Mathematics Studies, 24, Princeton University Press. 

[71] Kuhn H.W. and A. W. Tucker (eds.) (1953) : Contributions to the Theory of Games, //, Annals 
of Mathematics Studies, 28, Princeton University Press. 

[72] Laraki R. (2001) Variational inequalities, System of functional équations and incomplète infor- 
mation repeated games, SI AM Journal on Control and Optimization , 40 , 516-524. 

[73] Laraki R. (2001) The splitting game and applications, International Journal of Game Theory , 
30 , 359-376. 

[74] Laraki R. (2002) Repeated games with lack of information on one side : the dual differential 
approach, Mathematics of Operations Research , 27 , 419-440. 

[75] Laraki R., J. Renault et T. Tomala (2006) Théorie des Jeux , X-UPS 2006, Editions de l’Ecole 
Polytechnique. 

[76] Lehrer E. (1989) Nash equilibria of n player repeated games with semi-standard information, 
International Journal of Game Theory , 19 , 191-217. 

[77] Lehrer E. (1989) Lower equilibrium payoffs in two-player repeated games with non-observable 
actions, International Journal of Game Theory , 18 , 57-89. 

[78] Lehrer E. (1992) Correlated equilibria in two-player repeated games with non-observable actions, 
Mathematics of Operations Research , 17, 175-199. 

[79] Lehrer E. (1992) On the equilibrium payoffs set of two-player repeated games with imperfect 
monitoring, International Journal of Game Theory , 20 , 211-226. 

[80] Lemke C.E. and J. T. Howson (1964) Equilibrium points of bimatrix games, SIAM Journal , 12 , 
413-423. 

[81] Loomis L.H. (1946) On a theorem of von Neumann, Proceeding of the National Academy of 
Sciences of the U. S. A, 32 , 213-215. 



173 


[82] Martin D.A. (1975) Borel determinacy, Annals of Mathematics, 102, 363-371. 

[83] Mas-Colell A., M. Whinston and J. Green (1995) Microeconomic Theory , Oxford University 
Press. 

[84] May nard Smith J. (1981) Evolution and the Theory of G âmes, Cambridge University Press. 

[85] Mc Lennan A. and R. Tourky (2006) From imitation games to Kakutani, preprint. 

[86] Mertens J. -F. (1987) Repeated Games. Proceedings of the International Congress of Mathema- 
ticians (Berkeley), 1986 , American Mathematical Society, 1528-1577. 

[87] Mertens J. -F. (1989) Stable equilibria - A reformulation, Part I, Mathematics of Operations 
Research , 14 , 575-624. 

[88] Mertens J.-F. (1991) Stable equilibria - A reformulation, Part II, Mathematics of Operations 
Research , 16 , 694-753. 

[89] Mertens J.-F. (2002) Stochastic games, in Handbook of Game Theory , Vol. 3, Aumann R. J. and 
S. Hart (eds.), North Holland, 1809-1832. 

[90] Mertens J.-F. and Neyman A. (1981) Stochastic games, International Journal of Game Theory, 
10 , 53-66. 

[91] Mertens J.-F., S. Sorin and S. Zamir (1994) Repeated Games , CORE discussion paper 9420-9422. 

[92] Mertens J.-F. and S. Zamir (1971) The value of two-person zero-sum repeated games with lack 
of information on both sides, International Journal of Game Theory , 1, 39-64. 

[93] Mertens J.-F. and S. Zamir (1977) A duality theorem on a pair of simultaneous functional 
équations, Journal of Mathematical Analysis and Applications , 60 , 550-558. 

[94] Milgrom P. and R. Weber (1985) Distributional strategies for games with incomplète informa- 
tion, Mathematics of Operations Research , 10 , 619-632. 

[95] Mills H.D. (1956) Marginal value of matrix games and linear programs, in Linear Inequalities 
and Related Systems , Kuhn H.W. and A.W. Tucker (eds.), Annals of Mathematical Studies, 38 , 
Princeton University Press, 183-193. 

[96] Milnor J.W. (1965) Topology from the Différentiable Viewpoint, Princeton U. P. 

[97] Monderer D. and L.S. Shapley (1996) Potential games, Games and Economie Behavior , 14 , 
124-143. 

[98] Myerson R. (1978) Refinements of the Nash equilibrium concept, International Journal of Game 
Theory , 7, 73-80. 

[99] Myerson R. (1991) Game Theory , Harvard University Press. 

[100] Myerson R. (1998) Communication, correlated equilibria and incentive compatibility, in Hand- 
book of Game Theory , Vol. 2, Aumann R. J. and S. Hart (eds.), North Holland, 827-847. 

[101] Nash J. (1950) Equilibrium points in n-person games, Proceedings of the National Academy of 
Sciences , 36, 48-49. 

[102] Nash J. (1951) Non-cooperative games, Annals of Mathematics, 54 , 286-295. 

[103] Neyman A. and S. Sorin (2003) Stochastic Games and Applications , NATO Science Sériés, 
Kluwer Academie Publishers. 

[104] Nikaido H. and K. Isoda (1955) Note on non cooperative convex games, Pacific Journal of 
Mathematics , 5, 807-815. 



174 


Chapitre 9. Bibliographie 


[105] Nisan N., T. Roughgarden, E. Tardos and V. Vazirani (2007) Algorithmic Game Theory , Cam- 
bridge University Press. 

[106] Osborne M.J. and A. Rubinstein (1994) A Course in Game Theory , MIT Press. 

[107] Owen G. (1995) Game Theory , Academie Press. 

[108] Parthasarathy K. R. (1967) Probability Measures on Metric Spaces , Academie Press. 

[109] Parthasarathy T. and T.E.S. Raghavan (1971) Some Topics in Two-Person Games, Elsevier. 

[110] Pearce D. (1984) Rationalizable strategie behavior and the problem of perfection, Econome- 
trica , 52, 1029-50. 

[111] Renault J. (2000) 2-player repeated games with lack of information on one side and state 
independent signalling, Mathematics of Operations Research , 25, 552-572. 

[112] Renault J. (2006) The value of Markov chain repeated games with lack of information on one 
side, Mathematics of Operations Research , 31, 490-512. 

[113] Renault J. (2012) The value of repeated games with an informed controller. Mathematics of 
Operations Research , 37, 154-179. 

[114] Renault J. and T. Tomala (1998) Repeated proximity games, International Journal of Game 
Theory , 27, 539-559. 

[115] Renault J. and T. Tomala (2004) Communication equilibrium payoffs of repeated games with 
imperfect monitoring, Games and Economie Behavior , 49, 313-344. 

[116] Reny P. (1999) On the existence of pure and mixed Nash equilibria in discontinuous games, 
Econometrica , 67, 1029-1056. 

[117] Robinson J. (1951) An itérative method of solving a game, Annals of Mathematics, 54, 296-301. 

[118] Rosenberg D. and S. Sorin (2001) An operator approach to zero-sum repeated games, Israël 
Journal of Mathematics , 121, 221-246. 

[119] Rosenthal R. (1982) Games of perfect information, predatory pricing and the Chain Store 
Paradox, Journal of Economie Theory , 25, 92-100. 

[120] Rubinstein A. (1982) Perfect equilibrium in a bargaining model, Econometrica , 50, 97-110. 

[121] Rubinstein A. (1994) Equilibrium in supergames, in Essays in Game Theory in Honor of M. 
Maschler , N. Meggiddo (ed.) Springer-Verlag, 17-28. 

[122] Selten R. (1975) Re-examination of the perfeetness concept for equilibrium points in extensive 
games, International Journal of Game Theory , 4, 25-55. 

[123] Shapley L.S. (1953) Stochastic games, Proceedings of the National Academy of Sciences of the 
U.S.A. , 39, 1095-1100. 

[124] Simon R.S., S. Spiez and H. Torurïczyk (1995) The existence of equilibria in certain games, 
séparation for families of convex functions and a theorem of Borsuk-Ulam type, Israël Journal 
of Mathematics , 92, 1-21. 

[125] Sion M. (1958) On general minimax theorems, Pacific Journal of Mathematics , 8, 171-176. 

[126] Sion M. and P. Wolfe (1957) On a game without a value, in Contibutions to the Theory of 
Games, III , Dresher M., A.W. Tucker and P. Wolfe (eds.), Annals of Mathematical Studies, 39, 
Princeton University Press, 299-306. 



[127] Solan E. (1999) Three-Player absorbing games, Mathematics of Operation Research, 24, 669- 
698. 

[128] Solan E. and N. Vieille (2001) Quitting games, Mathematics of Operation Research , 26 , 265- 
285. 

[129] Sorin S. (1983) Some results on the existence of Nash equilibria for non-zero sum games with 
incomplète information International Journal of Game Theory , 12 , 193-205. 

[130] Sorin S. (1986a) On repeated games with complété information, Mathematics of Operations 
Research , 11, 147-160. 

[131] Sorin S. (1986b) Asymptotic properties of a non zero-sum stochastic game, International Jour- 
nal of Game Theory, 15 , 101-107. 

[132] Sorin S. (1992) Repeated games with complété information, in Handbook of Game Theory , Vol. 
1, R. J. Aumann and S. Hart (eds.), North Holland, 71-107. 

[133] Sorin S (1999) Merging, réputation and repeated games with incomplète information, Games 
and Economie Behavior , 29 , 274-308. 

[134] Sorin S. (2002) A First Course on Zero-Sum Repeated Games , Mathématiques et Applications, 
37, Springer. 

[135] Tarski A. (1955) A lattice theoretical fixed point theorem and its applications, Pacific Journal 
of Mathematics , 5, 285-308. 

[136] Topkis D. (1979) Equilibrium points in non zero-sum n person submodular games, SIAM 
Journal of Control and Optimization , 17 , 773-787. 

[137] Van Damme E. (1984) A relation between perfect equilibria in extensive form games and proper 
equilibria in normal form games, International Journal of Game Theory , 13 , 1-13. 

[138] Van Damme E. (1987) Stability and Perfection of Nash Equilibria , Springer. 

[139] Van Damme E. (1992) Refinement of Nash equilibrium, in Advances in Economie Theory (6th 
Congress Econometric Society), Laffond J. -J. (ed.), Cambridge University Press, 32-75. 

[140] van Damme E. (1994) Evolutionary game theory, European Economie Review , 34 , pp. 847-858 

[141] van Damme E. (2002) Strategie equilibrium, in Handbook of Game Theory , Vol. 3, R.J. Au- 
mann and S. Hart (eds.), North Holland, 1521-1596. 

[142] Vieille N. (2000a). Two-player stochastic games I : a réduction, Israël Journal of Mathematics, 
119 , 55-91. 

[143] Vieille N. (2000b). Two-player stochastic games II : the case of recursive games, Israël Journal 
of Mathematics, 119 , 93-126. 

[144] Vieille N. (2002) Stochastic games : recent results, in Handbook of Game Theory , Vol. 3, Au- 
mann R.J. and S. Hart (eds.), North Holland, 1833-1850. 

[145] Ville J. (1938) Sur la théorie générale des jeux où intervient l’habileté des joueurs, in E. Borel, 
Traité du Calcul des Probabilités et de ses Applications , Tome IV, Gauthier- Villars, 105-113. 

[146] Vives X. (1990) Nash equilibrium with strategie complementarities, Journal of Mathematical 
Economies , 19 , 305-321. 

[147] Von Neumann J. (1928) Zur Théorie der Gesellschaftsspiele, Mathematische Annalen , 100 , 
295-320. 



176 


Chapitre 9. Bibliographie 


[148] Von Neumann J. and O. Morgenstern (1944) Games and Economie Behavior , Princeton Uni- 
versity Press. 

[149] Weibull J. (1995) Evolutionary Game Theory , MIT Press. 

[150] Weyl H. (1950) Elementary proof of a minimax theorem due to von Neumann, in Contribu- 
tions to the Theory of Games, /, H.W. Kuhn and A. W. Tucker (eds.), Annals of Mathematical 
Studies, 24, Princeton University Press, 19-25. 

[151] Zamir S. (1992) Repeated games of incomplète information : zero-sum, in Handbook of Game 
Theory , Vol. 1, Aumann R.J. and S. Hart (eds.), North Holland, 109-154. 

[152] Zermelo E. (1912) Über eine Anwendring der Mengenlehrer auf die Théorie des Schachspiels, 
Proceedings of the Fifth International Congress of Mathematicians (Cambridge), 1912 , vol. II, 
501. 



Index 


agent normal form, 85 
application de Nash, 37 

better-reply secure, 39 

caractéristique d’Euler, 59 
champ de Nash, 58 
choix social, 6 

composante connexe d’équilibres, 43, 49 
composante essentielle, 57 
Cournot, 39, 125 

dilemme du prisonnier, 98 
dominance, 33 
duels, 117 

dynamique, 20, 55, 58, 59, 89 
dynamique de meilleure réponse, 21, 129 
dynamique du réplicateur, 60, 113, 129 

élimination itérée, 9, 36 

enchère de Vickrey, 113 

enchère double, 131 

ensemble d’information, 74 

e-équilibre, 36, 100 

équilibre S-parfait, 71, 80, 86 

équilibre corrélé, 89, 90, 136-138 

équilibre corrélé canonique, 91 

équilibre de Nash, 18, 36-42, 54, 71, 80 

équilibre parfait (Selten), 83, 85, 126, 127 

équilibre propre (Myerson), 83-86, 126, 127 

équilibre séquentiel, 81, 86 

ESS, 63 

extension mixte, 10, 11, 16, 29, 37 


fermeture du graphe d’un jeu, 39 

fictitious play, 20 

forme extensive, 65 

forme jeu, 9 

forme normale, 66 

forme normale réduite, 70 

histoire, 66, 72, 99 

indice (équilibre, composante), 59 
individuellement rationnel, 45 
induction amont, 68 
induction aval, 68 
information incomplète, 134 
information parfaite, 65 

jeu à somme nulle, 13, 16, 19, 20, 25 

jeu convexe, 127 

jeu dérivé, 30 

jeu de GNIM, 130 

jeu fini, 13, 33, 37, 38, 43 

jeu matriciel, 13 

jeu répété avec signaux, 106 

jeu sous forme extensive, 133 

jeu stochastique, 107 

jeu stratégique, 5 

jeux à information incomplète, 95 

jeux bayésiens, 95 

jeux coalitionnels, 5 

jeux déterminés, 67 

jeux de potentiel, 62, 128 

jeux discontinus, 25, 39 


177 



178 


Chapitre 9. Index 


jeux escomptés, 100 
jeux Animent répétés, 100 
jeux répétés, 8, 97 

jeux répétés à information incomplète, 108 
jeux uniformes, 100 
joueur hasard, 69 

Lemme de l’intersection, 25 

mémoire parfaite, 78 
marchandage, 132 

mariages stables de Gale et Shapley, 111 

maxmin, 14 

meilleure réponse, 9 

minmax, 14 

minmax 3 joueurs, 114 

non regret, 93 

opérateur valeur, 30 

paiements réalisables, 101, 124 
paradoxe de Condorcet, 7 
point de menace, 45 
profil, 9, 36 

quasi-concave, 26 
quasi-convexe, 26 

réciproquement-s.c.s., 41 
résoluble, 9 
rationalisabilité, 35 

s.c.i, 26 
s.c.s, 26 

sélection d’équilibre, 80 
saut de dualité, 14 
self-enforcing, 50 
semi-algébrique, 43 
sous-jeu, 66 
stratégie corrélée, 33 
stratégie de comportement, 77 
stratégie de distribution, 96 
stratégie dominante, 9 
stratégie faiblement dominée, 9 
stratégie mixte, 10 


stratégie prudente, 48 
stratégie pure, 16 
stratégie strictement dominée, 9 
stratégie strictement dominante, 9 
stratégies optimales, 15 
structure d’information, 90 
support, 16 

Théorème d’Aumann, 91, 103 

Théorème d’Aumann et Maschler, 110 

Théorème d’Isbell, 78 

Théorème de Blackwell, 94, 115, 120 

Théorème de Brouwer, 53 

Théorème de Gale et Stewart, 73 

Théorème de Glicksberg, 38 

Théorème de Kakutani, 53, 126 

Théorème de Kohlberg et Mertens, 55, 86, 88 

Théorème de Kuhn, 79 

Théorème de Ky Fan, 53 

Théorème de Loomis, 18, 114 

Théorème de Nash, 37, 38 

Théorème de Reny, 39, 40 

Théorème de Robinson, 20 

Théorème de Shapley, 103 

Théorème de Sion, 25, 41, 121 

Théorème de Tarski, 124 

Théorème de van Damme, 86 

Théorème de Ville, 19, 115 

Théorème de von Neumann, 16 

Théorème de Zermelo, 67 

Théorème du minmax, 15 

Théorème Folk, 102-104, 106 

Théorème Kreps et Wilson, 85 

transmission stratégique d’information, 135 

valeur, 14-16, 18-21, 26, 28, 30, 69, 107, 116 
valeur de l’information, 135 
variété des équilibres, 55, 125 



Dans la même collection 


Biologie 

Bioinformatique. Génomique et post-génomique - F. Dardel et F. Képès - 250 pages - ISBN 2-7302-0927-1 

Chimie 

Chimie moléculaire des éléments de transition - F. Mathey et A. Sevin - 300 pages - ISBN 2-7302-0714-7 

Les orbitales moléculaires dans les complexes - avec Exercices et Corrigés - Y. Jean 
350 pages - ISBN 2-7302- 1 024-5 

Chimie moléculaire, sol-gel et nanomatériaux - R. Corriu et Nguyen T.-A. 

208 pages - ISBN 978-2-7302-1413-1 

Introduction à la chimie quantique - P. Hiberty et Nguyen T.-A. - 320 pages - ISBN 978-2-7302-1485-8 

Informatique 

Introduction à la théorie des langages de programmation - G. Dowek, J.-J. Lévy 
1 1 2 pages - ISBN 978-2-7302- 1 333-2 

Les principes des langages de programmation - G. Dowek - 176 pages - ISBN 978-2-7302-1526-8 

Les démonstrations et les algorithmes : introduction à la logique et la calculabilité - G. Dowek - 200 pages - 
ISBN 978-2-7302-1569-5 

Économie 

Introduction à la microéconomie - N. Curien 
1 10 pages - ISBN 2-7302-0722-8 - ISBN 978-2-7302-0722-5 

Introduction à l'analyse macroéconomique - P. -A. Muet - 208 pages - ISBN 2-7302-1 140-3 

Économie de l'entreprise - J.-P. Ponssard, D. Sevy, H. Tanguy (2 e édition) 

3 1 6 pages - ISBN 978-2-7302- 1 244- 1 

Corporate Social Responsibility? From Compliance to Opportunity - P. Crifo, J.-P. Ponssard - 298 pages - 
ISBN 978-2-7302-1568-8 

Économie du climat. Pistes pour l'après-Kyoto - J.-P. Ponssard et O. Godard - 314 pages 
ISBN 978-2-7302-1576-3 

Mathématiques 

Le problème de Kepler. Histoire et théorie - A. Guichardet - 102 pages - ISBN 978-2-7302-1596-1 

Autour des inégalités isopérimétriques - Sous la direction de Alessio Figalli - 130 pages - ISBN 978-2-7302- 
1573-2 

Éléments d'analyse et d'algèbre (et de théorie des nombres) - Nouvelle édition - P. Colmez -67 8 pages - 
ISBN 978-2-7302-1587-9 

Transversalité, Courants et Théorie de Morse. Un cours de topologie différentielle (exercices proposés par François 
Labourie) - F. Laudenbach - 200 pages - ISBN 978-2-7302-1585-5 



Groupes et représentations - D. Renard - 223 pages - ISBN 978-2-7302-1571-8 

Milieux continus en transformations finies. Hyperélasticité, Rupture , Êlastoplasticité - C. Stolz - 278 pages - 
ISBN 978-2-7302-1562-6 

Éléments d'analyse et d'algèbre (et de théorie des nombres) - P. Colmez -488 pages-ISBN 978-2-7302-1563-3 
Cours d'analyse - J.-M. Bony - 272 pages - ISBN 2-7302-0775-1 

Calcul différentiel et intégral - F. Laudenbach - 220 pages - ISBN 2-7302-0724-4 

Méthodes mathématiques pour les sciences physiques - J.-M. Bony - 217 pages - ISBN 2-7302-0723-6 

Les théorèmes de Noether - Y. Kosmann-Schwarzbach, avec la collaboration de L. Meersseman 
180 pages - ISBN 2-7302-1 138-1 (2 e édition) 

Groupes et symétries. Groupes finis, groupes et algèbres de Lie, représentations - Y. Kosmann-Schwarzbach 
222 pages - ISBN 978-2-7302-1257-1 (2 e édition) 

Algèbre corporelle - A. Chambert-Loir - 200 pages - ISBN 2-7302-1217-5 

Calcul variationnel - J.-P . Bourguignon - 348 pages - ISBN 978-2-7302-1415-5 

Aspects des systèmes dynamiques - XUPS 1994- 1996 - N. Berline et C. Sabbah (Comité éditorial) 

238 pages - ISBN 978-2-7302-1560-2 

Aspects de la théorie du contrôle - XUPS 1999 - N. Berline et C. Sabbah (Comité éditorial) 

208 pages - ISBN 978-2-7302-1530-5 

Groupes finis - XUPS 2000 - N. Berline et C. Sabbah (Comité éditorial) 

104 pages - ISBN 2-7302-0751-5 

Pavages - XUPS 2001 - N. Berline et C. Sabbah (Comité éditorial) - 1 12 pages - ISBN 2-7302-0855-0 

La fonction zêta - XUPS 2002 - N. Berline et C. Sabbah (Comité éditorial) 

206 pages - ISBN 2-7302-1011-3 

Distributions - XUPS 2003 - Dans le sillage de Laurent Schwartz - N. Berline et C. Sabbah 
(Comité éditorial) - 106 pages - ISBN 2-7302-1095-4 

Graphes- XUPS 2004 - N. Berline et C. Sabbah (Comité éditorial) - 84 pages - ISBN 2-7302-1182-9 

Théorie algorithmique des nombres et équations diophantiennes - XUPS2005 - N. Berline, A. Plagne 
et C. Sabbah (Comité éditorial) - 200 pages - ISBN 2-7302-1293-0 

Théorie des jeux. Introduction à la théorie des jeux répétés - XUPS 2006 - N. Berline, A. Plagne 
et C. Sabbah (Comité éditorial) - 152 pages - ISBN 978-2-7302-1366-0 


Sur la dynamique des groupes de matrices et applications arithmétiques - XUPS2007 - 
N. Berline, A. Plagne et C. Sabbah (Comité éditorial) - 160 pages - ISBN 978-2-7302-1418-6 



Géométrie tropicale - XUPS2008 - P. Harinck, A. Plagne et C. Sabbah (Comité éditorial) 

1 28 pages - ISBN 978-2-7302- 1 529-9 

Les représentations linéaires et le grand théorème de Fermât - XUPS2009 - P. Harinck, A. Plagne et 
C. Sabbah (Comité éditorial) - 140 pages - ISBN 978-2-7302-1566-4 
Facettes mathématiques de la mécanique des fluides - XUPS2010 - P. Harinck, A. Plagne et 
C. Sabbah (Comité éditorial) - 1 18 pages - ISBN 978-2-7302-1578-7 

Histoire de mathématiques - XUPS201 1 - P. Harinck, A. Plagne et C. Sabbah (Comité éditorial) 

1 1 8 pages - ISBN 978-2-7302- 1 595-4 

Séminaires, équations aux dérivées partielles - Années 1971 à 1992 
Séminaires, équations aux dérivées partielles - Années 1993 à 2001 

Séminaires, équations aux dérivées partielles - Année 2000-2001 - 400 pages - ISBN 2-7302-0834-8 
Séminaires, équations aux dérivées partielles - Année 2001-2002 - 364 pages - ISBN 2-7302-0930-1 
Séminaires, équations aux dérivées partielles - Année 2002-2003 - 390 pages - ISBN 2-7302-1041-5 
Séminaires, équations aux dérivées partielles - Année 2003-2004 - 404 pages - ISBN 2-7302-1 183-7 Sémi- 
naires, équations aux dérivées partielles - Année 2004-2005 - 404 pages - ISBN 2-7302-1221-3 Séminaires, 
équations aux dérivées partielles - Année 2005-2006 - 366 pages - ISBN 2-7302- 1335-X 
Séminaires, équations aux dérivées partielles - Année 2006-2007 - 444 pages - ISBN 978-2-7302-1414-8 
Séminaires, équations aux dérivées partielles - Année 2008-2009 - 308 pages - ISBN 978-2-7302-1567-1 

Mathématiques appliquées 

Une exploration des signaux en ondelettes - S. Mallat - 654 pages - ISBN 2-7302-0733-3 

Promenade aléatoire - M. Benaïm et N. El Karoui - 316 pages - ISBN 2-7302-1 168-3 

Analyse numérique et optimisation - G. Allaire - 480 pages - ISBN 978-2-7302-1255-7 

Systèmes hyperboliques de lois de conservation . Application à la dynamique des gaz - F. Dubois, B. Després 
208 pages - ISBN 2-7302-1253-1 

Commande et optimisation de systèmes dynamiques - F. Bonnans et P. Rouchon 
286 pages - ISBN 2-7302-1251-5 

Les outils stochastiques des marchés financiers. Une visite guidée de Einstein à Black-Scholes - N. El Karoui et 
E. Gobet - 238 pages - ISBN 978-2-7302- 1 579-4 

Simulation stochastique et méthodes de Monte-Carlo - C. Graham et D. Talay - 210 pages - ISBN 978-2- 
7302-1582-4 

Aléatoire. Introduction à la théorie et au calcul des probabilités - S. Méléard - 280 pages - ISBN 978-2-7302- 
1575-6 

Mécanique 

Dynamique de l'atmosphère et de l'océan - P. Bougeault et R. Sadourny - 312 pages - ISBN 2-7302-0825-9 


Introduction aux écoulements compressibles et aux fluides hétérogènes - A. Sellier 
175 pages - ISBN 2-7302-0764-5 



Mécanique des milieux continus - J. Salençon 

Tome 1 - Concepts généraux - 376 pages - ISBN 978-2-7302-1245-8 (avec CD-Rom) 

Tome 2 - Thermoélasticité - 344 pages - ISBN 978-2-7302-1419-3 (avec CD-Rom) 

Tome 3 - Milieux curvilignes -15 4 pages - ISBN 2-7302-0962-X 

de TÊlasto-plasticité au Calcul à la rupture - J. Salençon 

(accompagné d’un CD-Rom réalisé par J. Salençon) - 266 pages - ISBN 978-2-7302-0915-1 

Viscoélasticité pour le calcul des structures -]. Salençon - 160 pages - ISBN 978-2-7302-1557-2 

Fluides et Solides - E. de Langre - 130 pages - ISBN 978-2-7302-0833-8 

Ondes acoustiques - A. Chaigne - 224 pages - ISBN 2-7302-0840-2 

Stabilité des matériaux et des structures - C. Stolz - 206 pages - ISBN 2-7302-1076-8 

Instabilités , Chaos et Turbulence - P. Manneville - 360 pages - ISBN 2-7302-0913-1 

Vibrations des structures couplées avec Le vent - P. Hémon - 144 pages - ISBN 2-7302-1332-5 

Analyse des solides déformables par la méthode des éléments finis - M. Bonnet et A. Frangi 
316 pages - 2-7302-1349-X 

Dynamique et vibrations - E. de Langre et A. Chaigne - 152 pages - ISBN 978-2-7302-1521-3 
Modélisation et calcul des milieux continus - P. Le Tallec - 560 pages - ISBN 978-2-7302-1494-0 
Poutres et arcs élastiques. P. Ballard et A. Millard - 312 pages - ISBN 978-2-7302-1561-9 
Hydrodynamique de T environnement. O. Thual - 328 pages - ISBN 978-2-7302-1564-0 
Microhydrodynamique et fluides complexes. D. Barthès-Biesel - 292 pages - ISBN 978-2-7302-1572-5 


Physique 

Physique des Tokamaks - Jean-Marcel Rax - 436 pages - ISBN 978-2-7302-1580-0 
Semi-conducteurs : les bases de la théorie k.p - G. Fishman - 742 pages - ISBN 978-2-7302-1497-1 
Énergie nucléaire - J.-L. Basdevant, J. Rich et M. Spiro - 340 pages - ISBN 2-7302-0901-8 
Mécanique quantique - J.-L. Basdevant et J. Dalibard 

(accompagné d’un CD-Rom de M. Joffre) 520 pages - ISBN 978-2-7302-0914-4 

Problèmes quantiques - J.-L. Basdevant et J. Dalibard - 214 pages - ISBN 2-7302-1 1 17-9 

Principes de la cosmologie - J. Rich, adaptation française J.-L. Basdevant - 400 pages - ISBN 2-7302-0925-5 

Introduction à la relativité - A. Rougé - 188 pages - ISBN 978-2-7302-0940-3 

Relativité restreinte. La contribution d’Henri Poincaré - A. Rougé - 288 pages - ISBN 978-2-7302-1525-1 



Introduction à la physique subatomique - A. Rougé - 448 pages - ISBN 2-7302-1231-0 

Physique statistique et illustrations en physique du solide . - C. Hermann - 292 pages - ISBN 978-2-7302-1022-5 

Bases physiques de la plasticité des solides - J.-C. Tolédano - 264 pages - ISBN 978-2-7302-1378-3 

Physique des électrons dans les solides. Structure de bandes, Supraconductivité et Magnétisme. H. Alloul - Tome 
1 - 360 pages - ISBN 978-2-7302-141 1-7 

Physique des électrons dans les solides. Recueil d exercices et de problèmes. H. Alloul 
Tome 2 - 272 pages - ISBN 978-2-7302- 1412-4 


www.editions.polytechnique.fr 



Achevé d’imprimer en février 2013 - Dépôt légal : 1 er trimestre 2013 
N° ISBN 978 - 2 - 7302 -1611 -1. Imprimé en France 




Mathématiques appliquées 



Rida Laraki est chercheur au CNRS et professeur à l'École polytechnique II enseigne 
à l'ENSAE, l'ENSTA et l'université Pierre et Marie Curie et a enseigné aux universités 
Paris Dauphine, Nanterre et Villetaneuse. 

Jérôme Renault, après des passages dans les universités Paris-Dauphine, Paris 1, au 
CNRS et à l'École polytechnique, est maintenant professeur à l'université Toulouse 1 . 

Sylvain Sorin est professeur à l'université Pierre et Marie Curie (Paris 6) après avoir 
enseigné aux universités Louis Pasteur (Strasbourg) et Paris X-Nanterre. Il a égale- 
ment été professeur à l'ENSAE et à l'École polytechnique. 

Cet ouvrage est destine aux étudiants en master ainsi qu'aux étudiants des écoles 
d'ingenieurs. Les connaissances mathématiques requises sont celles d'une licence 
scientifique. 


Ce cours est consacré à une présentation des principaux concepts et outils mathé- 
matiques de la théorie des jeux stratégiques 

L'accent est mis sur l'exposé et les preuves des résultats fondamentaux (minmax et 
opérateur valeur, équilibre de Nash et corrélé) 

Par ailleurs certains développements recents sont présentés : variété des équilibres, 
dynamiques de sélection, apprentissage et jeux répétés. 

L'ouvrage comporte une importante section d'exercices et corriges. 



POLYTECHNIQUE 

Tech 


ISBN 978-2-7302-1611-1 



9 782730 216111 




